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第 1 卷 / 基本算法（第3版） 

丛书第1卷以基本的程序设计概念和技术开 
始，然后专注于信息结构——计算机内部信 
息的表示、数据元素之间的结构关系及其有 
效处理方法。描述了模拟、数值方法、符号 
计算、软件与系统设计的初等应用。新版本 
增加了几十项简单但重要的算法和技术，并 

对有关数学预备知识做了大量修正以适应现 
时研究的趋向。 • 


第2卷/半数值算法（第3版） 

第2卷对半数值算法领域做了全面介绍，分 

“随机数”和“算术”两章。本卷总结了主要 

算法范例及这些算法的基本理论，广泛剖析 

了计算机程序设计与数值分析间的相互联系。 

第3版中特别值得注意的是 Knuth 对随机数 

生成程序的重新处理和对形式幂级数计算的 
讨论。 


第3卷/排序和查找（第2版） 

第3卷的头一次修订对经典计算机排序和查 
找技术做了最全面的考察。它扩充了第1卷 
对数据结构的处理，以将大小数据库和内外 
存储器一并考虑；遴选了精心核验的计算机 
方法，并对其效率做了定量分析。第3卷的 
突出特点是对“最优排序” 一 节的修订和对 
排列论与通用散列法的讨论。 
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O dear Ophelia \ 

I om ill ot these numbers ： 
I have not ort to reckon my groans . 

亲爱的奥菲 利娅; 

这些数真让人 烦恼: 

我可没有计算我的愁怀的技巧 。 x 

— Hamlet (Act 11 5 Scene 2, Line 120) 

本书所讨论的算法直接地涉及数。但我相信把它们叫做半 数值算 法是适当的， 
因为它们处于数值和符号计算的边界线上。每个算法不仅计算数值问题所要求的 
答案，而且也应与一台数字计算机的内部操作很好地融合。在许多情况下，人们都 
不可能充分品味某个算法的美，除非他也懂计算机机器 语言； 相应的机器程序的有 
效性是不能同算法本身分开的一个重要因素。问题是寻找出计算机处理数的最佳 
方法，这既要考虑数值，又要研究策略。因此本书的主题显然既是数值数学的一个 
部分，也是计算机科学的一个部分。 

在数值分析的“高层次”上工作的某些人将把这里处理的课题当做是系统程序 
员的领域，而工作在系统程序设计“高层次”上的其他人将把这里处理的课题当做数 
值分析的领域。但我相信，还会剩下一些人，他们将愿意仔细地考察这些基本方法。 
尽管这些方法或许处于低层次上，但是它们却奠定了计算机在数值问题上的所有更 
强大应用的基础，因此了解它们就很重要了。在这里我们最关心的是数值数学和计 
算机程序设计之间的界面。正是这两种技巧的结合，才使这一课题变得如此有趣。 

本书比起本丛书的其它卷来，其数学内容所占比例要显著地高得多。这是由于 
所处理的课题所致。大多数情况下，在这里所展开的必要的数学课题几乎都是从很 
皮毛的内容开始的（或者从第1卷证明的结果开始的）。但是在若干部分，显然仍需 
要读者具有一定的微积分学知识。 

本卷是由整套丛书的第3章和第4章组成的。第3章涉及“随机数 ”：它 不单单 
是对生成随机序列的各种方法的研究，它还研究随机性的统计检验，以及一致随机 
数与其它类型随机量间的 转换; 后一课题说明在实践中如何使用随机数。本章还有 


" 朱生豪译文为：“亲爱的奥菲利娅啊，我的诗写得 太坏； 我不会用诗句来抒写我的愁怀。”（《哈姆莱特》，朱 

生豪译，吴兴华校，1997年人民出版社出版。）鉴于译文难以准确表达作者的意旨，本书特将作者引文原文附 
上。以下同。 本书责任编辑 
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一 节包括了随机数本身的性质。第 4 章的意图是讲述经历了数百年的进步之后，人 
类对算术运算的有趣 发现； 它论述了表示数的各种系统，以及在这些系统之间如何 
进行 转换； 而且它还处理关于浮点数、高精度整数、有理数、多项式及幂级数的算术 
运算，也包括因子分解和求最大公因子等问题在内。 

第3章和第4章均可作为从大学三年级到研究生层次的一学期课程的基础。 

尽管“随机数”和“算术”的课程现在都不是许多大学课程表的一部分，但我相信，读 
者会发现这两章的学科内容本身是有实际教育价值的，非常适合于统一论述。我本 
人的经验是，这些课程是向大学生们介绍初等概率论和数论的很好的手段。通常， 
在这样的入门性课程中讨论的几乎所有课题都很自然地在同应用相关联中出现，而 
这些应用可以成为促进学生学习和鉴赏理论的重要因素：其次，每一章都给出一些 
更深入课题的提示，它们将激发许多学生进行进一步研究的兴趣： 

本书的大部分内容都是自成体系的，除了偶尔涉及在第 1 卷中说明的 MIX 计算 
机的讨论外。附录 B 列出了本书所用的数学符号，其中一些符号与传统数学书中略 
有差别。 


% 3版前言 


本书的第2版完成于1980年，它实际上也是电子排版系统 T E X 和 META ¬ 
FONT 的第一个重大的测试实例。现在我高兴地用它（正是为了它我萌发了开发电 
子排版系统的念头）的第3版庆祝 T E X 和 METAFONT 的全面开发成功。最终我 

将能以一致的格式拥有《计算机程序设计艺术》的所有各卷，而这将使它们很容易适 
应未来在印刷和显示技术上的变化。这些进展已经使我得以把长期以来一直想要 
做的数以千计的改进收到这些书中。 

我逐字逐句地审阅了新版的所有文字，在或许加上一些更为深思熟虑的论述的 
同时，我试图保留原来句子的 朝气； 增添了几十道新习题，还对几十道旧的习题给出 
了新的和改进了的答案。变动随处可见，但最主要的是在 3.5 节（关于随机性的理 
论保证）， 3. 6节（关于可移植的随机数生成程序）， 4.5. 2小节（关于二进制的最大公 
因子算法，以及 4.7 节（关于幂级数的合成和迭代）。 

f 然而，《计算柷程序设计艺术》的写作仍然是进行中的工作。关于半数值算 
法的研究继续以非凡的速度在发展着。因此，本书的某些部分被冠以“正在施工”的 
图标，用于对该部分的内容还不是最新表示歉意。我的文件中已经挤满了许多重要 
的素材。我打算从现在开始用大约16年的时间，把这些素材包含在第2卷最后的 
辉煌的第4版中，但是，我必须首先完成第4卷和第5卷，而且除非绝对需要，我一 
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刻也不 想拖延它们的出版。 

我要向在过去35年来帮助我搜集和 改进这 些素材的数百位人们致以最衷心的 
感谢。准备新版本的大多数困难工作是由 SUvo Levy 完成的，他熟练地编辑电子文 
本，而 Jeffrey Oldham 则负责把几乎全部图形转换成 METAFONT 的格式。我已经 
把机敏的读者们在第2版中所发现的每一个错误（以及，竟无人发现的一些错误）都 
做了 改正； 而且我已经力图在新的材料中不引进新的错误。然而，我想仍然会存在 
某些缺点，我要尽快地改进它们。因此我将高兴地支付 2.56 美元给每一个技术、印 

刷或历史错误的头 一 位发现者，在网页 http :// www - cs - faculty . Stanford . edu /~ knuth / 

taocp . html 列出了向我报告过的所有错误的更正， 

Stanford , California D . E . K . 

1997年7月 

■ 

When o book hos been eight years in the making ， 
there ore too many colleagues y typists , students , teachers ， ond friends to thank . 

Besides , i hove no intention of giving such people 
the usual exonerotion from responsibility for errors which remain . 

They should hove corrected me | 
And sometimes they ore even responsible for ideas 
which may turn out in the long run to be wrong . 
Anywoy y to such fellow explorers , my thonks. 

当一本书已经编写了 8 年时，需要感谢的 
同事、打字员、学生、老师和朋友真太多了。 
此外，我无意对这些人宣布，对于遗留的错误，他们不负责任。 

他们应当帮助我改正它们! 
而且有时他们也应对一些经过长时间考验被证实是错的那些思想负责。 

但无论如何，对于这样的同行探索者，我都要表示衷心感谢! 

— EDWARD F. CAMPBELL,JR. ( 1975) 

‘ Defendit numerus y y [ there is safety in numbers 

is the maxim of the foolish ； 
4 Deperdit numerus 7 [ there is ruin in numbers 

of the wise . 

“数能保平安”是极大的愚蠢; 

“数中有祸”是明智的。 

—C 丄 COlTON( 1820) 


* 中文版已按 2003 年 1 月 25 日的最新勘误表更正 / 原书的错误。网页 http：// www. ndip. com. cn/com- 
puter ■ 上也列出了对中文版的勘误表，我将很诚挚地对发现中文版错误的读者表示感谢，但我不敢保证也支付 
您 2.56 美元。——本书责任编辑 
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关于习题的说明 


本套书的习题既可用于自学，也可用于课堂练习。无论是谁，如果想纯粹地通 
过阅读，而不将所阅读的信息应用到特定问题上，并由此牵引思考先前阅读的内容， 
就想学到一门学问，纵然可能，那也是很困难的。其次，对于我们自己的发现，我们 
总是领会得最透。因此，习题形成了这一套书的一个重要 部分； 我着意使这些习题 
含有丰富的信息，而且也尽量选择既有趣又有启发性的习题。 

在许多书里，容易的习题被随机地混杂于极端困难的问题当中。有时这是不合 
适的，因为读者预先想要知道一道习题花多少时间——否则他们可能跳过这些习题 

了事。这一情况的典型例子是由 Richard Bellman 所著的 Dynamic Programming — 

书。这是一本重要的先驱性的论著，其中在某些章的末尾，在“习题和研究题”的标 
题下，把一组问题收集在一起，而且一些极其平凡的问题出现在一些深入的、还未被 
解决的问题当中。据说，有人曾问过 Bellman 博士 ，怎样 区分习题和研究题。他回 
答说 :“如 果你能解决它，那它就是一道习题，否则它就是一个研究题。” 

但在这一类书里把研究问题和很容易的习题都包括进来确有其 道理； 因此，为 
使读者免于陷入确定哪是习题哪是研究题的困境，我给习题注明了等级分，以指出 
困难的程度。这些分数大体具有下列 意义： 

分数 解释 

00 一个极其容易的问题，如果你已理解正文的内容，就可立即做出回 

答。这样一道题几乎总是可以“眉头一皱”就把它做出。 

10 一个简单的问题。它要求你去思考刚刚学过的内容，但绝不意味着 

是困难的。你应当有能力在顶多一分钟之内就把它做出。在获得解 
答的过程中可能要用到笔和纸。 

20 一个普通的问题。它检查你对正文内容的基本理解，但你可能需要 

十五或二十分钟才能完整地回答它。 

30 一个中等难度或中等复杂的问题。这个题目可能需要两个小时以上的工 

作才能令人满意地解决。或者甚至更长时间，如果电视机在开着的话。 • 

40 确实是一个十分困难或冗长的问题。在学校里，它将适合于作为一 

个学期的课程设计。 一 个学生应当有能力在相当长的时间里解决 
它，但这个解不会是平凡的。 

50 就作者在编写本书时所知，这是一个还未令人满意地解决的问题，尽 

管已经有很多人做了尝试。如果你已经找到了这样一个问题的答 
案，你应当把它写出来发表。其次，本书的作者将乐意尽快地听到关 
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关于习题的说明 


于这一解答的消息（当然，假定它是正确的）。 

通过在这个“对数”尺上的内插，其它分数的意义也就清楚了。例如17分将表示 
比普通的题更为简单的一道习题。 一 个随后被某个读者解决了的50分的题在本书后 
来的版本中将以45的分数出现，而且会在互联网上的勘误表中刊出（参见版权页）。 

分数除以5的余数表示所要求的详细工作量。因此分数是24的习题可能要比 
分数是25的题花费更长的时间来求解，但后者将要求更多的创造性。 

作者已经认真地试图指定精确的分数，但是提出问题的人要想确切地知道，所 
提问题对求解的另一个人难度如何，肯定是困 难的； 而且每个人都会有较其他人更 
为适应的问题类型。只能希望这些分数较好地反映了习题的困难程度，希望读者把 
它们当做一般的导引，而不应作为绝对的指标。 

本书是为具有不同程度的数学训练和素养的读者写的；有些习题是特意为有更 
多数学基础的读者提供的。如果一道题的出题动机或涉及的数学概念超越了主要 
兴趣仅仅是算法编程本身的读者应掌握的程度，则在分数前边加上 M 。 如果一道 
习题的答案必须涉及在本书中未予提供的微积分或其它高等数学知识，则对这道题 
标以 “ HM ” 的字母。 “ HM ” 标记并不必定意味着困难。 

某些习题的前边标有三角符号“ ►”； 这说明是特别有启发性的问题，因而特别 
予以推荐。当然，并不期望读者/学生来求解所有的习题，所以标出了那些看起来最 
有价值的部分(这并不意味着贬低其它习题！）。每个读者至少应该尝试去解分数是 
10或者更低的所有 问题； 三角符号可以帮助指出应该对具有较高分数的哪些问题 
予以优先考虑。 

在答案部分中已经列出大多数习题的解答，请明智地使用它们。在你已真正地 
做出努力亲自解决问题之前，不要去翻答案，除非你确实没有时间来做这一特定的 
习题。在获得了你自己的解答或者对该题做了郑重的尝试之后，你可能会感到答案 
是有启发和有帮助的。给出的解答通常十分简短，作者认为你已经认真地通过自己 
的方法做过求解尝试，因而略去了其细节。有时解答所提供的信息比所要求的为 
少，但通常都是更多的。十分可能，你有比这里给的更好的答案，或者在答案中你发 
现一个错误。在这样的情况下，作者将乐意知道详细的情况。在本书以后的版本中 
将在适当地方刊登岀这些改进了的答案以及提供这些解的人的姓名。 


当做一道习题时，一般地你可以使用前边习题的答案，除非明确地禁止这样做。 
在对习题打分时，已经考虑到这一点了，因此很可能第 n + 1 题的分数比第 n 题还 
要低，尽管它把第 n 题的结果作为一个特殊情况包括进来。 


代码含义 


00 

立即可解的 



10 

简单的（一分钟） 



20 

一 般水平（一刻钟） 

► 

特别推荐的 

30 

难度适中 

M 

面向数学的 

40 

学期设计 

HM 

要求“髙等数学”的 

50 

研究题 
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关于习题的说明 


► 1 . [00] 分数 “ M 20” 意味着什么？ 

2 . [ 10 ] 在一本教科书中的习题对读者来说有什么价值？ 

3. [34] Leonhard Eu[er 在 1772年猜测，方程 w 4 + _ r 4 + / =之 4 没有正整数解，但 Noam Elkies 
在 1987 年证明，它有无穷多个解[见 Math . Comp . 51 (1988) ，825〜 835] 。试求使得 

<^<10 6 的所有整数解。 

4. [ M 50] 试证明，当 n 是整数， n >4 时，方程 W + Y + 没有正整数的加， * x ，： y ，2： 的 

解。 

Exercise is the beste instrument in lesrnyng . 

习题是学习的最好手段。 

ROBERT REC0RDE ， T7ie Whetstone of Witte (1557) 
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第 3 章随机数 


Any one who considers arithmetical methods 
of producing random digits is } of course 9 in o stole of sin . 

任何考虑用算术方法产生随机数字的人 

都是在做错事。 

—— JOHN VON NEUMANN (1951) 


Lest men suspect your tale untrue ， 

Keep probability in view. 

为了避免人们怀疑你的故事的真实性， 

请不要忘了概率。 

— JOHN GAY ( 1727) 


There wonted not some beams of light 
to guide men in the exercise of their Stocostick faculty . 

不需要什么光芒来照引人们 
去使用他们的随机本领。 

— JOHN OWEN (1662) 

3.1 引 言 

“随机地选择”的数，有许多不同类型的应用。 例如： 

a ) 仿真当使用一台计算机仿真自然现象时，就需要用随机数使事情变得逼 
真。仿真涉及从核物理(其中粒子受到随机的碰撞）直到运筹学（比如说，人们在随 
机的时间里进入一个飞机场）的许多领域。 

b ) 抽样通常，要考察所有可能的情况是不实际的，而随机的抽样将使我们能 

了解“典型”的行为。 

c ) 数值分析 利用随机数已经想出了许多巧妙的技术来解复杂的数值问题。 
关于这个课题，已有不少专著。 

d ) 计算机程序设计 为检验计算机算法的有效性，随机值乃是数据的好来源。 
更重要的是，随机值对于随 机化算 法的运算是很要紧的，随机化算法经常比确定性 
算法要优越得多。随机数的使用是我们在这套书中所关注的主要应用，所以我们要 
在第3章，即在讲其它大多数计算机算法之前，先讲随机数。 
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e ) 决策据说，有许多决策人通过抛硬币或掷飞镖等等来做出他们的判断。还 
听说某些大学教授也以此为基础来评分。有时，做出这样完全“无偏见”的判断是重 
要的。随机性也是矩阵游戏理论中优化策略的必不可少的部分。 

f ) 美学一点儿随机性就会使计算机生成的图形和音乐似乎更活泼。例如，下 
面左边的图案在某些场合就比右边的更有吸引力。 

□□□□□□□□ □□□□□□□□ 

□□□□□□□□ □□□□□□□□ 

□□□□□□□□ □□□□□□□□ 

[请见 D . E . Knuth , Bull . Amer . Math . Soc . 1 (1979),369。] 

g ) 娱乐摇骰子、洗扑克牌、转轮盘等，是人们很喜爱的娱乐方式。随机数的这 
些传统用法，已经被命名为“蒙特卡罗方法”，它已成为描述任何使用随机数的算法 
的通用术语。 

考虑这一课题的人们几乎总是碰到关于“随机”一词含义的哲学性讨论。在某 
种意义下不存在什么随机数。例如，2是一个随机数吗9我们宁愿谈论具有一个确 
定 分布的独立的随机数序列。 这大致意味着，每个数的出现都只是偶然的，并且与 
这序列中的其它数无关，每个数落人任何给定的范围都有一个确定的概率。 

在一个有限数集上的一个一致分布是一个这样的分布，其中每个可能的数都有 
相等的概率。凡分布一般都认为是一致的，除非特别说明是某种其它分布。 

在一个（一致的）随机数字序列中，0到9这10个数中每一个数出现的次数约为 
1/10,每一对连续数字出现的次数约为1/100,等等。然而，如果我们取一个有100 
万个数字的真正的随机序列，则它总不会恰好有10万个0,10万个1，等等。事实 
上，这种机会是十分微 小的； 而由这种序列组成的序列，则平均地具有这一特征。 

100万个数字的任何一个特定的序列，和任何其它序列都是同等可能的。因 
此，如果我们正随机地选择100万个数字，而其中的头999 999个碰巧已经是0,则 
最后一个数字是0的机会，在一个真正随机的状态下，仍然恰恰是1/10。这些说法 
对很多人来说似乎是自相矛盾的，但事实上并非如此。 

对于一个随机序列的抽象定义，有许多好的描述方式。我们将在 3.5 节回头来 
讨论这个有趣的问题。但眼前，还是让我们来直观地了解这一概念吧！ 

许多年前，那些在科学工作中需要随机数的人们，用从一个“充分转动起来”的 
坛子中抓出球来或摇骰子、分牌之类的办法获得随机数。1927年， L . H . C . Tippett 
发布了超过40 000个随机数字的一张表，那些数字是“从人口统计调查报告中随机 
地取得的”。自那以后，已经造出了一些特殊的装置，用来机械地生成随机数。1939 
年， M . G.Kendall 和 B . Babington-Smith 使用头一部这样的机器造出了有100 000个 
随机数字的一张表。1951年首次安装的 Ferrarm Mark I 计算机有一个内置指令，它 
使用一个电阻噪声生成器将20个随机位放进累加 器中； 这一功能受到了 A . M . Tur ¬ 
ing 的推荐。1955年， RAND 公司又公布了一张被广泛使用的有100万个随机数字 
的表，这张表是利用另一部特殊装置得到的。一台取名为 ERNIE (厄尼）的著名随 
机数机器被使用了许多年，用于产生英国政府有奖债券的中奖号码。[见 Kendall 和 


Babington-Smith 白勺论文， J . Royal Stat . Soc . A101 ( 1938) ， 147 〜 166 ; B 6 ( 1939) ， 51 〜 
61。 也见 S . H.JLavington 对 Mark I 的讨论， CACM 21 ( 1978)，4 〜 12 ; 以及对 RAND 
表的评论 : Math - Comp . 10 (1956) ， 39 〜43。 也见 W . E . Thomson 对 ERNIE 的讨论， 
J . Royal Stat . Soc . A122 (1959) ， 301 〜333。 ] 

在计算机问世之后不久，人们开始探求在计算机程序中求随机数的有效方法。 
可以使用一张表，但由于内存空间和输入时间的要求，这种方法的实用性有限，因为 
这种表可能太短了，而且编制和维护这种表也是一件麻烦的事情。可以把诸如 
ERNIE 这样的机器连到计算机上，如同在 Ferranti Mark I 中所做的那样，但这也并 
不令人满意，因为当校验一个程序时，它实际上不可能再一次精确地重复以前的计 
算； 而且，这类机器还经常会发生不易查出的故障。20世纪90年代技术的发展又 
使表变得有用起来，因为 CDROM 上可以分布（存储 ）1 GB 的经过测试的随机数。 
1995年 ， George Marsaglia 将 一 个噪声二极管的电流输出与确定的经过扰频的 rap 
音乐叠加在一起生成了 650 MB 的随机值（他称之为黑白噪声）并把它们做成演示光 
盘，因而促进了随机数表的复兴。 

早期用机械方式生成随机数的缺点，引起了人们利用一台计算机的普通算术操 
作来产生随机数的兴趣。 1946 年前后， John von Neumann (冯诺伊曼）头一个建议利 
用这种方法；他的办法是取前面的随机数的平方，并抽取中部的数字。例如，如果正 
在生成 10 位数字，而且先前的值是 5772156649, 则把它平方得到 

33317792380594909201 

因此下一个数就是 7923805949。 

对于这种技术，有十分明显的异议：既然每个数完全由它先前的数所决定，那么 
以这样的方法产生的序列怎么会是随机的呢？（请见本章开始处冯诺伊曼的评述。） 
回答是，这个序列不是随机的，仅仅像是随机的而已。在典型的应用中，一个数与跟 
在它后面的那个数之间的真实关系并无客观的意义，因此，这种非随机的特征并不 
真是不可取的。从直观上看，平方取中似乎相当充分地搅乱了前面的数。 

用这样一种确定的方法生成的序列，在高深的学术著作中通常都叫做伪随机或 
拟随机序列，但在本书中我们简单地称之为随机序列，只不过把它们理解成只是看 
起来像随机的罢了。也许任何随机序列最多只能说是“显然随机的”。凡是仔细地 
选择了适当的方法的，在计算机上以确定方式生成的随机数，都已十分成功地用于 
几乎每一项应用之中。当然，确定的序列并不总是答案，它们肯定不应代替 ERNIE 
来抽奖。 

已经证明，冯诺伊曼原来的“平方取中法”并不是求随机数的好方法。危险在于 
这个序列容易出现重复元素的短循环。例如，如果0 —旦作为这个序列的一个数出 
现，则它将不断地重现本身。 

一些人在20世纪50年代初曾以“平方取中法”进行了实验。 G . E . Forsythe 用 
4位数字代替10位数字，试验了 16个不同的初始值。结果发现，其中的12个导致 
了以循环6100,2100,4100,8100,6100,…为结局的序列，而其中有两个退化成0。 
N . Metropolis 对平方取中法进行了广泛的试验，试验中大多采用二进数系统。他证 


第 3 章随机数 


明 了：用 20位数字进行工作时，序列可能退化成13个不同的循环，其中最长的循环 
周期为142。 

当发现了 0时，很容易用一个新的值重新开始平方取中法，但不容易避免长的 
循环。习题6和7讨论了确定循环序列周期的某些有趣方法，只须使用很少的存储 
空间。 

在习题9 和 10中，指出了平方取中法的一个理论上的缺陷。另一方面， 
N . Metropolis 用38位数工作，在出现退化之前得到了大约750 000个数的序列，而 
且得到的750 000 X 38位数字满意地通过了随机性的统计检验。 [ Symp . o/i Mon re 
Carlo Methods ( Wiley ，1956)，29 〜 36。] 这个实验证明，平方取中法能给出有用的结 
果，但是在没有实施精心的计算之前，对它过于信任还是危险的。 

在最初编写本章时，人们所使用的许多随机数生成程序都不是很好的。人们习 
惯于不去研究这样的子程序，某些相当不令人满意的老方法仍被盲目地从一个程序 
员传到另一个程序员，以至用户对它原有的局限性一无所知。在本章我们将看到， 
掌握有关随机数生成程序的要点并不困难，尽管为避免通常易犯的错误，谨慎从事 
是必要的。 

要想出一个十分简单明了的随机数生成程序并不容易。作者在1959年就对此 
有深刻体会，当时试图利用下列特定的方法来建立一个非常好的随机数生成程序： 

算法 K (“超 随机”数生成程序） 给定一个10位的十进制数 X ，本算法可以用 
来把 X 变为一个像是随机序列中的下一个数。尽管可以预期这个算法能得出一个 
相当随机的序列，但后面提到的理由说明了它事实上并非十全十美。（读者除了注 
意这个算法的复杂性外，不必详尽地研究它。请特别注意 K 1 和 K 2。） 

ki . [选择迭代次数]置 y — Lx / io 9 」， 即置 x 的最高位有效数字。（我们将 

执行步骤 K 2 到 K 13 Y + 1 次； 亦即，我们应用随机变换随机次。） 

K 2. [选择随机步骤]置 Z — LX /10 8 」mod 10,亦即，置 X 的第二位最高有效 

数字，转向步骤 K (3 + Z ) 0 (亦即，我们转到程序中的一个随机步骤。） 

K 3. [确保 >5 X 10 9 ] 如果 X < 5000000000,则置 X^X + 5000000000 c 

K 4. [平方取中]以 LX 2 /10 5 」 modl 0 1 G 代替 X ，亦即，以 X 平方取中来代替 X 。 

K 5. [乘]以 （1001001001 X ) mod 10 10 代替 X 。 

K 6. [伪补数]如果 X < 100000000,则置 X — X + 9814055677;否则置 X — 

10 10 -x o 

K 7. [互换两半]把 X 的后 5 位数字与前 5 位数字互换，即置 X -10 5 (X mod 

10 5 ) + LX /10 5 J , B |](10 10 + 1 )X 的中间 10位数字。 

K 8.[ 乘]同步骤 K 5。 

K 9 .[减小数字]把 X 的十进表示的每个非0数字减1。 

K 10. [99999 修改]如果 X < 10 5 ,则置 X ^ X 2 + 99999,否则置 X — X - 

99999。 

K 11. [规格化](这时 X 不能为0。）如果 X <10 9 , 则置 X —10 X 并重复这一 
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步骤。 

K12. [修改过的平方取中法]以 LX ( X -1)/10 5 」mod 10 1 G 代替 X ，亦即，以 

x ( x - l ) 的中间10位数字代替 X 。 

K13. [重复？]如果7>0，则7减1并返回到步骤 K 2。 如果 Y = 0, 则本算 

法终止，以 X 作为所求的“随机”值。_ 

(对应于上述算法的机器语言程序竟是如此复杂，以至不借助于注解来读它的 
清单时，人们将不知道这个程序是干什么的。） 

考虑到算法 K 的复杂设计，这一算法似乎能产生无穷尽的令人难以置信的随机 
数，但事实上，当把这个算法头一次放到计算机上时，它几乎立即收敛到10位数值 
6065038420——非常巧合，本算法把这个数转换成它自己（见表1)。若以另外一个 
数开始，则这个序列在7 401个值之后，开始以长度为3 178的周期进行循环。 


表 1 非常巧合 ：算法 K 把数 6065038420 变成它自己 


步骤 

x( 之后） 

步骤 

x( 之后） 

K1 

■ 

6065038420 

K9 

1107855700 

層 

K3 

6065038420 

K10 

1107755701 

K4 

6910360760 

K11 

1107755701 

K5 

8031120760 

K12 

1226919902 Y-3 

K6 

1968879240 

K5 

0048821902 

K7 

7924019688 

K6 

9862877579 

K8 

9631707688 

K7 

7757998628 

K9 

8520606577 

K8 

2384626628 

K10 

8520506578 

K9 

1273515517 

K11 

8520506578 

K10 

1273415518 

K12 

0323372207 Y-6 

K11 

1273415518 

K6 

9676627793 

K12 

5870802097 Y-2 

K7 

2779396766 

K11 

5870802097 

K8 

4942162766 

K12 

3172562687 Y=l 

K9 

3831051655 

K4 

1540029446 

K10 

3830951656 

K5 

7015475446 

K11 

3830951656 

K6 

2984524554 

K12 

1905867781 7 = 5 

K7 

2455429845 

K12 

3319967479 Y-4 

K8 

2730274845 

K6 

6680032521 

K9 

1620163734 

K7 

3252166800 

K10 

1620063735 

K8 

2218966800 

K11 

1620063735 


K 12 


6065038420 Y = 0 
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这个事 m 的教益是，随机数并不是通过随机地选择的方法就可生成的，应当便 

用某些理论。 

在以下的诸节中，我们将考虑比平方取中法和算法 K 更为优越的随机数生成程 
序，确保对应的序列具有某些所希望的性质，并且不出现退化。我们将稍微详细地 
剖析一下这种类随机行为的原由，而且也将考虑对随机数进行操作的技术。例如， 
我们要研究的问题之一是：在一个计算机程序内洗一副模拟的扑克牌。 

3.6 节将对本章进行小结并列出若干参考文献。 

习题 

► 1 . [20 ] 假设你希望不使用计算机来随机地得到一个十进数，问下列方法哪一个合适？ 

a ) 随机地打开一本电话号码簿（亦即，随意地翻开一页）并且采用所选页上找到的头一个数 
的个位数字。 

b ) 和 a ) —样，但所用的是页号的个位数字。 

c ) 掷一个具有正二十面体形状的骰子，它的二十个面已经标以数字0,0，1，1，…，9,9,当这个 
骰子停下来时使用出现于顶部的数字。（建议在铺有毡子的硬质桌面上掷骰子。） 

d ) 让一个盖氏计数器在放射性源下暴露一分钟（注意自身防护），并采用所得到计数的个位 
数字。假设盖氏计数器以十进制显示所记的数，并假设计数从0开始。 

e) 看看你的手表，如果秒针的位置在6〃 和 6(77 + 1) 之间，则选择数字 ^7 。 

f ) 让一个朋友来想一个随机数字，并采用他说出的这个数字。 

g ) 让一个“敌人”来想一个随机数宇，并釆用他说出的这个数字。 

h ) 假设有十匹马进行竞赛，而你对于这十匹马的资历毫无所知。以任意的方式把数字0〜9 
赋予这些马，并在竞赛结束后采用优胜者的数字。 

2. [ M 22] 在一个有100万个十进数字的随机序列中，每个可能的数宇出现100 000次的概率 
是多少？ 

3. [10] 按平方取中法，1010101010之后是什么数？ 

4. [20] ( a ) 当实施了算法 K 的步骤 K 11 之后，为什么 X 的值不能为0?如果 X 竟然为0,则 
算法出了什么问题？ （ b ) 使用表1推导，当以初始值 X = 3830951656重复应用算法 K 时会发生什 
么情况。 

5. [15] 鉴于预先就知道由算法 K 所生成的任何序列最终都将是周期的（即使不出现如表1 
所示的巧合），试说明为什么在任何情况下都不能期望算法 K 提供无限多的随机数。 

► 6.[ M 2 J ] 假设我们要生成一个在范围内的整数序列…，令 / U ) 是 

任 一 函数，使得若< m ， 贝 U /( J ：) < m 。 试考虑由规则 X n + j - f(X n )形 成的一个序列 Q 

(例子是平方取中法和算法 K 。） 

a ) 说明这个序列在下述意义下终归是周期的：存在数； I 和对于它们，值 XcX ,,--, 
\，…，是不 同的； 但当时，有 + A = 试求出 p 和 A 的极大和极小的可能值。 

b ) ( R . W . Floyd ) 证明存在一个7? >0,使得又,= X 2 n ，且这种 n 的最小值在"< + ；1 的 

范围内。而且，在下述意义下 X ，，的值是惟一的：如果 = 且 l = 则 X r = X n 。 

c ) 使用 b ) 的思想，试设计对于任何给定的函数/和给定的 X 。来计算 p 和 A 的一个算法，且 
仅使用 0(" + A ) 步和有限数量的内存夢元。 
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► 7.[ M 2】]( R . P . B re nt ，1977) 令 《 U ) 是小于或等于《的2的最大次幂，例如，八15 )= 8和 

a ) 借助于习题6中的符号，证明存在一个” > 0，使得 ,,)- p 求一公式，它用"和 A 
表;^ 72的最小值。 

b ) 应用这一结果来设计一个算法，把此算法和形为 X ,, + 1 = /( X 71 ) 的任何随机数生成程序联 
用，即可防止它无限地循环。你的算法应该计算周期长度 A ， 并且它只应当使用少量的存储空间 

——你不能简单地存储所有计算出来的序列值！ 

8. [23.] 用两位十进数对平方取中法做全面检验。 

a ) 我们可以从100个可能的值00,01，…，99中的任何一个来开始这个过程，这些值中有多 
少最终将导致重复的循环00,00,…？[例 子：从 43开始，我们得到序列43,84,05,02,00,00, 

00 ,…。] 

b ) 有多少可能的最终循环？最长的循环是多长？ 

c ) 在这个序列重复以前，哪个（或哪些）开始值将使序列中不同元素的个数为最大？ 

9. [ M 14] 证明用6进制的位数的平方取中法有下列缺 点：如 果序列包括有其最高《位 

有效数字为0的任何数，则后继数将越变越小，直到重复地出现0为止。 

10. [ M 16] 在上题的假定下，如果 X 的最低《位有效数字为0,则关于 X 之后的数列有何特 

性？如果最低 n +1位有效数字为0,又如何？ 

► 11. [ M 26] 考虑有习题6中所述那种形式的随机数生成程序序列。如果我们随机地选择 
/ U ) 和 X a ， 换句话说，如果我们假定个可能的函数 / U ) 的每一个都是同等可能的，而且假定 

的 m 个可能的值的每一个也都是同等可能的。问这个序列最终退化为一个长度 A =1的循环 

的概率是多少9 ( 注： 在这个问题的假定中给出了考虑这类“随机的”随机数生成程序的一个自然 
的方式。可以考虑一个像算法 K 这样的方法，这个方法具有某些类似于这里所考虑的平均生成 

程序的特性。从这个问题的答案可以看出表1异常地巧合的程度。） 

► 12. [ M 31] 在上题的假定之下，最终循环的平均长度是多少？在开始循环之前，序列的平均 

长度是多少？（使用习题6的符号，我们希望考察 A 和一十 A 的平均值。） 

13. [ M 42] 如果 /(_ x ) 是在习题11的意义下随机地选定的，则通过改变开始值 X G ， 得到的最 

长循环的平均长度是多少？（注 ：在 /(工）是一个随机排列的情况下，我们已经考虑了类似的问 
题。见习题1.3.3-23。） 

14. [ M 38] 如果 /(： r ) 是在习题11的意义下随机地选定的，则通过改变开始值而得到不同的 

最终循环的平均个数是多少？[参考习题 8 b )。] 

15. [ Mi 5] 如果 /( I ) 是在习题11的意义下随机地选定的，则不管如何选择，不存在长度 

为1的最终循环的概率是多少？ 

16. [15] 如习题6 中那 样生成的序列，在至多生成个值后，必然开始重复。假设我们推广 
这个方法，使得足, + 1 既依赖于 X ，,也依赖于又,_ 1; 形式地说，令/(工，30是一个这样的函数，即如 

果 〈饥 ，则0</(工，30<爪。任选和 X "然后令 

X，, + 1 = /( ， X„-[ ) , 72 > 0 

试问这样构造出来的序列可能达到的极大周期是多少？ 

11. [10] 推广上题的情况，使得 x, l + ，依赖 于这个序列的前々个值。 

18.[ M 20] 试创立一个类似于习题7的方法，以找出习题17中所讨论的随机数生成程序的 
一般形式下的循环。 
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19. [ M 4 S ] 在更一般的情况下，\ +1 依赖于这个序列前面的々个 值；个函数 /(〜，•••， 
A ) 的每一个都认为是同等可能的。试对这种情况求解习题11到习题15。（注意，在习题 

2.3.4.2-23 中分析了产生极大周期的函数个数。） 

20 . [30 ] 求所有的非负： r <10 1 Q ， 它们经由算法 K 最终导致表 i 中的自再现的数。 

21. [42] 证明或 反驳： 由算法 K 定义的 X 的映射恰有长度为3178,1606,1024,943 

和1的五个循环。 

22 .[21 ]( H . Rolletschek ) 通过使用序列 /⑻，/( I )，/(2)，…而非: r 0 ， / U 0 ) ， /(/ U 0 )) ，…生 

成随机数，是否一个好想法？其中/是一个随机函数。 

► 23. [ M 2<5]( D . Fo ⑽和 A . Fuchs , 1970) 证明在习题6中考虑的”广个函数/“）的每一个都 

可表示为有下列性质的一个序列 （ ，>2^，…， x ,,, _ i ) 。 

i ) (工 0 ，工1，…，: — t ) 是(/(0)，/(1 )，…， /(m _ 1)) 的一个排列。 

ii ) (/(0)，…，/( w _ 1)) 可以从 （ jt 0 ，…，:-。惟一地构造出来 c 

iii ) 出现在/的循环元素是 U 。， A ，…，^^丨，其中^是使得这々个元素都不相同的最大下 

标。 

iv ) & $丨，々 ，…， y | 意味着巧_丨=/ (: c ; .) ，除非七是在/的循环中的最小元素。 

v ) (/(0)，/( 1 ) ，…， /( m - 1 )) 是 （0 ，1 ，…， m - 1 ) 的一个排列，当且仅当通过 1.3.3 小节的 
“非寻常对应是该排列的逆。 

vi ) xq - 当且仅当通过习题 2.3. 4 .4-18 的构造， /( a :) 是 jt 的父亲， （ t r Q ，…， : r n , _ •!) 表示一 

个有向树。 

3.2 生成一致随机数 

在这一节里，我们将考虑生成一随机分数（一 致地分布于 0 和 1 之间的随机实 
数 的序列的方法。由于一台计算机仅能以有限的精度来表示一个实数，故我们 

实际上将生成在0和某个数 m 之间的整数 X ， z 。 分数 

= X n Im 

便处于 0 和 1 之间。通常， m 是计算机字的大小，所以&可以（保守地）看成是一 
个计算机字的整数内容，小数点假定是在最 右边； 而 L /„ 可以（大体上）看成是同一 
字的内容，它的小数点假定在最左边。 

3.2.1 线性同余法 

当今使用的最流行的随机数生成程序是 D . H.Lehmer 1949年介绍过的下列方 

案的特殊情况 [ JaL Proc .2 nd Symp . on Large-Scale Digital Computing Machinery 
( Cambridge , Mass . : Harvard University Press , 1951) ， 141 〜 146] 。我们选择 4 个魔术 

整数： 
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w ，模 ¥ 数； 0 < m 

a ， 乘数； m 

c ， 增量； 0< c<m 

X 0 , 开 始值； 0< Xo<m 

然后通过置 

X n + i = ( aX n + c ) mod m , n ^ 0 (2) 

而得到所求的随机数序列 〈 X „>。 这个序列称做线 性同余序列。 对 m 求余有点像确 

定转动的轮盘上球的落点。 

例如，当 m = 10 和 X D = a = c = 7 时，得到的序列是 

7,6,9,0,7,6, 9,0,-* (3) 

如此例所示，对于 m ， a ， c 和的所有选择，这个序列并不总是“随机”的。本章的 

后面部分将仔细探讨适当选择这些魔术数的原则。 

例子 (3) 说明了同余序列总是进入一个循环的事实，亦即，它最终必定在72个数 
之间无休止地重复循环。这个性质对于具有一般形式 X 7; + 1 = /( XJ 的任何序列都 

是共同的，这里/把一个有限集合转换成它 自身； 参见习题3.1-6。这种重复的循环 
称为周期，序列 （3) 有一个长度为4的周期。一^个有用的序列当然应有相当长的周 
期。 

c = 0 的特殊情况值得明确指出，因为 c = 0 时数的生成过程比时要稍微 
快些。我们后面看到 ， c = 0 的限制缩短了这个序列的周期长度，但是它仍然有可能 
得到一个相当长的周期。 Lehmer 原来的生成方法只有 c =0 的情况，尽管他提岀了 
c ^ O 的可能性。取 c ^ O 来得到更长的周期的想法是分别由 Thomson [ Comp .；. 1 
(1958)，83,86]和 Rotenberg [ JACM 7 (1960) ，75 〜 77 ] 提岀来的。许多作者用术语 
乘同余 法和混 合同余 法来分别表示 c = 0 和 c ^ O 的线性同余法。 

这一章自始至终都将在上述意义下来使用字母和 X Q 。 而且，我们发现 

为了简化公式，定义 

b — a - 1 (4) 

将是有用的。 

我们可以立即排除 a = 1的情况，因为这将意味着 = ( X 0 + nc ) mod m ， 因而 

可以肯定它不具有随机序列的特性。而 a =0的情况甚至更坏。因此为实用起见可 
以假定 

a > 2, b^-l (5) 

现在我们可以证明等式 （2) 的一个推广 

X n + k — ( a k X n + ( a k - 1) cl b ) mod m , k ^ 0, n ^ 0 (6) 

它借助于第〃项来直接表达第 （〃 + 々） 项。（在这个等式中 的特殊情况值得注 


* 本书 “ 模 ” 与 mod ， mcxk>b 或 modukis 对应，可作名词、动词，也可作介词。作动词时含义为 “ 做模运 算 ”; 
作介词时含义为 “ 以 …… 为模 ” 。 modulo 在算式中出现时一般未予译出。——本书责任编辑 
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意。）由此得出，由〈 X ,,〉的每第々项组成的子序列是另一个线性同余序列，该子序列 
具有乘数 mod m 和增量 （（ a 1 ’ - 1 ) c /6 ) mod 。 

等式 （6) 的一个重要推论 是：由 和定义的一般序列，能非常简单地借 
助 c = l 和 Xq ==0 的特殊情况来表 7 K 。 设 

= 0, y „ + i = ( aY „ + 1) mod (7) 

根据等式（6)，我们得到 Y k = ( a k - l )/ b ( modulo 川），因此，等式 （2) 中定义的一般 

序列满足 

X” 二 {AY n + X 0 ) mod m ， 其中 A = ( X 0 ^ + c) mod m (8) 

习题 

l .[ i 0] 例 （3) 显示 = 这样一个情况，所以这个序列再次从起点开始。试举出 W = 的 
线性同余序列的一个例子，对于这样一个例子， X 。绝不会在该序列中再次出现 ： 

► 2.[ M 20] 证明 ：如果 a 和;72是互素的，则数心将总是出现于周期中： 

3. [ M ]0 ] 如果 a 和 m 不互素，试说明为什么这个序列不太完备并旦大規不是很随机的，因 
此我们一般都要求乘数 a 和模数 m 互素。 

4. [ n ] 证明等式（6)。 

5 - \ M 20 ] 对于々>0,等式 （6) 成立。如果可能，试对于负的々值，给出借助于义，表示 X , ; + A 
的公式。 

i- 

3.2.1.1 模数的选择 我们当前的目标是为定义线性同余序列的参数寻求好 

的值。让我们首先考虑数 772 的适当选择。既然一个周期不可能多于 W 个元素，我 

们希望 m 的值稍微大些。（即使一个人只想生成随机的0和1，他也 不应取 m 二 2, 

因为这个序列最好也只有形式…，0，1，0，1，0，1，...！在 3.4 节，讨论了通过修改随 
机数来得到随机的0和1的方法。） 

影响对772的选择的另一个因素是生成速度 ：我们 要挑选一个值，使得+ 

c ) mod m 的计算很快。 

以 MIX 为例，我们可以通过把 y 放进寄存器 A 和 X 中然后除以 m 来计算 

: y mod m 。 假定 : y 和 m 为正，我们将 看到 ； y mod m 出现在寄存器 X 中。可是除法 

操作比较慢，如果我们把772取成特别方便的值，例如取成计算机的 字大小 ，则可避 
免用除法。 

令 W 是计算机的字大小， W 在 e 位的二进制计算机上是2%在 e 位的十进制计 
算机上是10% (在本书中我们将经常使用字母 e 表示任意的整指数，而不是自然对 
数的底，希望这一符号在文中不至于引起歧义 ^ /物理学家在使用 e 表示电子的电荷 
时，也会遇到同样的问题。）加法运算的结果通常在模 w 后给出，除非在1的补码机 
器上；而乘法模 w 也很简单，因为所求结果是乘积的低位一半。因此，下面的程序 

* 中译本用正体的 e 表示自然对数的底，而用斜体的 e 表示任意整指数。 —— 本书责任编辑 
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有效地计算 （aX + c ) mod w : 


LDA A r A — a 

MUL X rAX —( rA).X 

SLAX 5 rA—rAX mod zv (1) 

ADD C rA — (rA + c ) mod w I 


结果出现在寄存器 A 中。溢出标志在这些指令结束后可能是 开的； 如果不希望出现 
这种情况，可以在代码后加上 “JOV * + 1”关闭溢出标志。 

一个不太为人所知的聪明技术可用于模^ + 1的计算。鉴于后文将解释的原 
因，我们一般希望 m = w + l 时 ， c = 0, 所以我们只须计算 aXmod ( u ，+ l )。 下面的 
程序完成这 一 计算： 


01 

LDAN 

X 

rA —— X 

02 

MUL 

A 

rAX <_ ( rA ) • a 

03 

STX 

TEMP 


04 

SUB 

TEMP 

rA—rA — rX 

05 

JANN 

* + 3 

如果 rA >0, 则出口 

06 

INCA 

2 

r A—r A + 2 

07 

ADD 

=- 1 = 

rA—rA + vo — \ 1 


( 2 ) 


寄存器 A 现在即含有值“ X ) mod (w + lh 当然，这个值可以位于0和 w 之间的 
任何一点，包括0和 w 在内，因而读者自然会产生疑问，寄存器 A 怎么表示这么多 
的值！（这个寄存器显然不能保存大于 w - l 的数。）回答是 ：当且 仅当结果等于 w 
时，上面的程序才会导致溢出（假定开始时溢出标志是闭的）。我们可以以0来表示 
w ， 因为当 X = 0 时，通常将不使用程序（2)。如果溢出出现于同余序列模 + 1) 
中，最方便的就是简单地拒绝 w 的值。于是，我们也就可以避免溢岀。这只须把程 

序 （2) 的行05和06改成 “JANN ^ + 4; INCA 2; JAP 5”就可以了。 

为了证明程序 （2) 果真确定 UX ) mod (w + 1), 请注意，在行04中我们从乘积 
的上半部减去下半部，这一步不会出现 溢岀； 而且如果 gw + r ， 其中 0< r < 
tx ； ，则在04行之后，在寄存器 A 中我们得到量 r - g ，现在 

aX = qivu 1) + (r ~ q) 

而且因为我们就有 - 因此 （) mod ( + 1) 或者等于 r - 

g ， 或者等于 r~g + (w + l )， 视 r - gX ) 或 r - q < 0而定。 

采用类似的技术可以得到两个数的乘积对 （ w -1) 的模； 见习题8。 

在后几节中，要求有关于 m 的素因子的一些知识，以便正确地选择乘数 a 。 表 
1列出了对于几乎每一个已知的计算机字大小 功土1 的完全素因子分解，如果需要， 
4.5.4 小节的方法可用来扩充这个表。 

读者很可能会问，既然选择 m = zv 明明方便得多，何以还要自寻烦恼地考虑使 
用 m = 呢？ 原甩在于，当 7 n = w 时， X n 低位数字与高位数字相比，其随机性 
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要弱得多。 如果 d 是 m 的一个因子，而且 


Y n = X n mod d 


(3) 


则我们可以容易地证明 


Y „ + 1 = { aY n + c ) mod d ⑷ 

(因为对于某个整数 q y X n + i = aX n + c - qt ^， 当3是肌的因子时，两边对 d 取模就 
消去了 gm 。） 

为了举例说明等式 (4) 的意义，假设我们有一台二进制的计算机。如果 m w 
= X n 的低四位是 h = mod 2 4 o 等式 （4) 的要旨是，&的低四位形成其长 

度为16或更短的周期的一个同余序列。类似地，低五位也是周期的，其周期至多是 
32,而且；^的最低有效位或者是常数，或者严格地在0和1之间交替着。 

当 m = w ± l 时，就不出现这个情况。这时，；^的低位的特性恰像高位一样地 

随机。例如，假定 m = 2 35 及 m = 2 35 _ 1， 而我们又只考虑它们模31，71，127或 
122921的余数(参考表1)，则这个序列的数就不是很随机 的了； 但低位（它表示这个 
序列取模2的数）却是令人满意地随机的。 


表1 加±1 的素因子分解 


2 亡 - 1 

e 

一 1 - ... . . . ■ ■ 

2 〜 1 

7-31-151 

15 

3 2 .11 .331 

3-5-17-257 

16 

65537 

131071 

17 

3*43691 

3 3 十 19.73 

18 

5.13_37.109 

524287 

19 

3*174763 

3-5 2 -11.31.41 

20 

17-61681 

7 2 -127 -337 

21 

3 2 . 43-5419 

3-23-89-683 

22 : 

5.397.2113 

47-178481 

23 

3-2796203 

3 2 -5«7-13*17-241 

24 

97.257.673 

31-601-1801 

25 

3-11*251*4051 

3-2731-8191 

26 

5^53-157-1613 

7.73.262657 

27 

3 4 *19*87211 

3-5-29-43-U3-127 

28 

17-15790321 

233-1103-2089 

29 

3*59*3033169 

3 2 -7-11-31-151-331 

30 

5 2 -13-41-61-1321 

2147483647 

31 

3*715827883 

3-5-17-257-65537 

32 

641-6700417 

7-23-89-599479 

33 

3 2 .67.683.20857 

3*43691-131071 

34 

5-137-953-26317 

3W1.127.122921 

35 

3-11-43-281-86171 

3 3 -5-7-13-19-37-73-109 

36 

17-241.433.38737 

223-616318177 

37 

3*1777-25781083 

3-174763-524287 

38 

5-229-457-525313 

7-79-8191.121369 

39 

3 2 -2731 -22366891 
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(续） 


2 & -1 

e 

2 e + 1 

3-5 2 -11-17-31-41-61681 

40 

257*4278255361 

13367.164511353 

41 

3*83-8831418697 

3 2 -7 2 -43-127-337-5419 

42 

5-13*29-113-1429^14449 

431-9719-2099863 

| 

43 

3*2932031007403 

3^5*23-89-397-683*2113 

44 

17-353-2931542417 

7.31.73.151.63 W 3311 

45 

3 2 -11-19*331^18837001 

3-47- 178481^2796203 

46 

5-277-1013-1657-30269 

2351-4513-13264529 

47 

3-283*165768537521 

3 2 -5 -7-13-17-97-241-257- 673 

48 

193-65537-22253377 

179951-3203431780337 

59 

3^2833-37171-1824726041 

3 2 -5 2 -7-11-13-31*41-61*151 -331-1321 

60 

17*241-61681-4562284561 

7 2 • 73 • 127 • 337 • 92737 - 649657 

63 

3 3 •19•43•5419•77158673929 

3 • 5 • 17 . 257 • 641 . 65537 • 6700417 

64 

274177-67280421310721 

10 e -l 

e 

10^ + 1 

3 3 -7-11-13-37 

6 

101-9901 

3 2 -239 *4649 

7 

11-909091 

3 2 *11-73-101*137 

8 

17-5882353 

3 4 -37 *333667 

9 

7-1 M 3-19-52579 

3 2 .11.41.271-9091 

10 

101.3541.27961 

3 2 -21649-513239 

11 

ll 2 -23^4093^8779 

3 3 -7- ll -13-37-101*9901 

12 

73•137•99990001 

3 2 -11-17-73-101*137-5882353 

16 

353*449-641*1409-69857 


另一个方案是令 m 为小于 w 的最大素数，利用 4.5.4 小节的技术，可以找到这 
个素数，而且在该节中有充分大的素数的表。 

在大多数应用中，低位是不重要的，因此假如使用随机数的程序员明智地选择 
m = W ，则结果便十分令人满意了。 

我们迄今的讨论都是以 MIX 这样的“带符号量”的计算机为基础的。尽管有某 
些指令的变化，但类似的想法也适用于使用补码的机器。例如， DEC 20计算机有36 
位二进位，并使用2的补码的算术 运算； 当它计算两个非负整数的乘积时，低半部包 
含低有效位的35位和一个加号。因此，在这样的机器上，我们将取 W = 2 35 , 而不是 
2 36 。在 IBM System/370 计算机上，32位的2的补码算术是不 同的： 一个乘积的低 
半部含完全的32位。某些程序员觉得这是一个缺点，因为当操作数为正时低半部 
可能为负，而改正它却是一件麻烦 的事; 但是从随机数生成的观点来看，这实际上是 
—个明显的优点，因为我们可以取 m= 2 32 而不是2 31 (见习题4)。 

习题 

r 

l .[ MJ 2] 在习题 3.2.1-3 中，我们知道最好的同余生成程序要求 a 与 m 互素。试证明在这 
种情况下，有可能仅用三条 MIX 指令来计算 U_X + c ) mod w ， 而不是像程序 （1) 中那样用四条。计 
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算结果在寄存器 X 中。 

2. [16] 试写出具有下列特征的一个 MIX 子 程序： 

>• 

调用序列 : JMP RANDM 
人口条件 ：单元 XRAND 含一整数 X 
出口 条件： X — rA—(aX + c ) mod w ， rX — 0,溢出关闭 
(因此，调用这个子程序将产生一个线性同余序列的下一个随机数。） 

► 3.[ M 25] 许多计算机都不提供以一个字长的数来除两个字长的数的 能力； 它们仅提供单字 
长的数的运算，例如当： c 和: y 都是小于字大小 w 的非负整数时 ， himuit (x , y ) -l xy\w J , 

lomult ( x , y ) — xy mod 加。假定 （X a ，: r <772<7 xi ， 而且 w 丄 w ， 试说明怎样借助于 himuit 和 

lomult 来计算 mod w 。 你可以使用依赖于 a ， ttz 和 w 的预先计算的常数。 

► 4. [21 ] 在诸如 IBM Systeni /370 系列这样的2的补码机器上，对于 m = 2 32 ，讨论线性同余序 
列的计算。 

5 . [20 ] 假定 m 小于字大小，而且是小于 w 的非负整数，试证明差 （* r - 3O mod m 可仅 
以四条 MIX 指令来计算，而不用做任何除法。试问，为求和式 （x + >0 mod m ， 最好的程序是什么？ 

► 6 .[ 20 ] 上题指出，减法模 m 比加法模 m 更易于实现。试讨论由规则 

X „ + 1 - ( aX n - c ) mod m 

生成的序列。这些序列与在上文中定义的线性同余序列有实质的差别吗9它们是否更适合于在 

计箅机上有效地计算？ 

7.[ M 24] 在表1中你能看出什么模式？ 

► 8 .[20] 写出计算 UX ) mod (w - 1) 的类似于程序 （2) 的一个 MIX 程序。在你的程序的输人 
和输出中，值 0 和应看做是等价的。 

► 9.[ M 25] 大多数髙级程序设计语言都不提供以单字长的整数来除两个字长的整数的好方 
法，它们也不提供习题3中的 himuit 运算。本题的目的是对于变量 工和对 于常数 0< a < m ， 当我 
们希望计算 OX mod 772时，找出对付这样的局限的一个合理的方法。 

a ) 证明如果 = 我们有 a{x - (x mod q )) = Ixl q K?n - (m mod a )) 。 

b ) 使用幻的恒等式来计箅 oo : mod m ， 而无须计算绝对值超过 m 的任何数，假定 a ^ m 。 

10 . [ M 26] 习题9 b ) 的解答有时在 a 2 > m 时也有效。对于 0 和 m 之间的所有: c ， 精确地说， 

有多少个这样的乘数 a ， 对于它说来，在该方法下中间结果绝不超过 w ? 

11 . [ M 30] 继续习题9,说明有可能仅仅使用下列的基本运箅就能计算 ax mod m ： 

i ) w X r ，其中 wX ) ， iX ) 和 uv 〈 m .， 

ii ) L w / f 」，其中 0 < < m ; 

iii ) L w - r」mod m ，其中 um 。 

事实上，通过 0 和 ii ) 的至多 12 种运算，以及 iii ) 的有限个数的运算，而不用预先计算依赖于 a 和 
m 的常数，就总有可能来做这件事。例如，试说明，当 a 是62089911和 m 是 2 31 - 1时，应如何进 
行。（这些常数出现在表 3.3.4-1 中。） 

► 12.[ M 28] 考虑用笔和纸或算盘的计算。 

a ) 什么是以10来乘一个给定的10位数，再对9999998999取模的好方法？ 

b ) 同样的问题，但代之以乘 999999900( 模9999998999)。 

c ) 对于 77 = 1，2,3，_，说明怎样计算幂999999900” mod 9999998999。 

d ) 把这样的计算同1/9999998999的小数展开联系起来。 

e ) 说明，这些思想使 得：通 过对每个生成的数只使用一些运算，就有可能实现某种类型的线 
性同余生成程序。 
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13. [ M 24] 重复上一道题，但对模 9999999001 以及乘数10和 8999999101 进行。 

14. [ M 25] 推广上两道题的思想，得到有非常大的模的一大类线性同余生成程序。 

3.2.1.2 乘数的选择 在这一小节中，我们将说明怎样选择乘数 a ， 以给岀具 
有极大长度的 周期。长的周期对于任何用作随机数来源的序列来说是必不可少的。 
确实，我们总是希望这个周期所含的数比任何具体应用中所需求的要多得多。因 
此，在本节中，我们将研究周期长度的问题。然而，读者应该记住，长周期对于序列 
的随机性说来，仅仅是所希望的准则之一。例如，当 a = c = l 时，这个序列只不过是 
+ ! = ( X „ + 1 ) mod 7 ? 2 ,它显然有长度为 m 的周期，但它绝不是随机的。有关选 

择一个乘数的其它考虑，将在这一^章的后面部分给出。 

由于只可能有 m 个不同的值，故周期确实不可能大于 m 。 我们能达到极大长 
度 m 吗？上面的例子说明这总是可能的，但是选取 a = c = l 不能产生所求的序列。 
让我们来研究得到周期长度 m 的 a ， c 和 Xo 的所有可能的选择。结果是，所有这样 

的参数值都可非常简单地加以 表征； 当 m 是不同素数的积时，只有 a = 1才产生完 
全的周期，但当 m 可被某个素数的高次幂整除时， a 的选择才有相当大的范围。下 
面的定理使我们很容易指出周期是否为极大。 

定理 A 由 m ， a * X Q 所定义的线性同余序列有周期长度 m 当且仅当 
•0 c 与 m 互素； 

ii ) 对 于整除 m 的每个素数 p ， b 二 a _ 1 是 p 的倍数; 

iii ) 如果 m 是4的倍数，则 b 也是4的倍数。 

用于证明这个定理的思想至少可追溯到100年前。但在 m 二 2 e 的特殊情况 
下，在这种具体形式下的定理的头一个证明是由 M . Greenberger 给岀的[见 JACM 8 
(1961) ，163〜 167] ，而 Hull 和 Dobell 证明了在一般情况下条件0 ， H ) 和 iii ) 的充分性 
[ JALS/AM Review 4 (1962) ，230〜254 ] 。为证明这个定理，我们首先要考虑本身就 

很有趣的某些辅助性的数论结果。 


则 


引理 P 设 p 是一个素数， e 是一个正整数，其中 p e >2 ， 如果 

x = 1( modulo p e ) , x ^ modulo p e + l ) ( 1 ) 

x p = 1( modulo p e+l ), x p ^ 1( modulo p e+2 ) (2) 

证明 对 于不是 f 的倍数的某个整数心我们有 工=1 十吵％ 由二项式公式 









)^1 P 

P V p 






圆括弧中的量是一个整数，而且事实上圆括弧中除去第一项之外，各项都是 P 的倍 


数，因为如果1<々<0，则二项式系数可为 f 所整除（参见习题1.2.6-10)。因 
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P 


(k- \ )e 


可为^卜⑴所整除。最后一项是 — 由于当 p e >2 时， - l ) e > l ， 因 
而它可为 P 所整除。于是：^三 l + 砂 £ ^ + : l ( modul 0 / + 2 )，证毕。（注 ：习题 3.2.2- lla ) 是 

这个结果的推广 。）I 


引理 Q 设把 m 分解成素因子 

m = p e t < (3) 

则由 （ X & a ， c ， m ) 所确定的线性同余序列的周期长度 X ，是诸线性同余序列 

( Xq mod pjj , a mod p ]>, c mod p e y , p e y ) 的周期长度 的最小公倍数，其中， l ^ j^t 0 

证明对 Z 用归纳法，只须证明，如果％与 w 2 互素，则由 

所确定的线性同余序列的周期长度 A 是序列 （mod vi x , a mod m {1 c mod m !, 

m [ )^\( Xq mod m 2 , a mod ， c mod 7722,7722) 的周期长度 和 的最小公倍数。 

根据 3.2.1.1 小节的等式(4)，如果这三个序列的元素分别记为，则将有 

Y n ~ X n mod m 1 和 mod 2 ，对于所有” ^ 0 

因此，由 1.2.4 小节的定律 D , 我们发现 

x n = x k 当且仅当 y , = y , 和乙= 厶 (4) 

设和 A 2 的最小公 倍数； 我们希望证明 A / = ； l 。 由于对于所有适当大的 

it 二尤 + A ，我们有 L = K + A (因此 A 是；^的倍数），且 Z „ = Z „ + A (因此 A 是；1 2 

的倍数），所以必然其次，我们知道，对于所有适当大的 n ， Y ， Y n + y , 

2„ =之„ + ；^ ; 因此由式（4)，尤=又 + ；^。这证明 A <； f 。 所以 A = A 、 ! 

现在着手证明定理 A 。 由引理 Q 知，只须对 w 是一个素数的乘幂这种特殊情 
况证明定理 A 就够了。这是因为，当且仅当对于 = 冷时， 

… p e C = A = lcm ( Ai ，…， A ,) < 久 1 … A , < 抑…於 

为真。 

因此，假定 m ，其中/>是素数是正整数。当 a = 1时定理显然为真，所 
以可取 a > l 。 当且仅当每个可能的整数 0< x < m 都出现于这个周期中时，周期长 
度才能为 m 。 因为在周期中没有出现一次以上的值，因此周期长度为 m 当且仅当 
X 0 = 0 的序列的周期长度为/«，而且有理由假设 X 0 = Oo 由公式 3.2. 1-(6)，我们有 

X n = ( 1 2 j c mod m (5) 

如果 c 不与 m 互素，则绝不能为1，所以定理的条件0是必要的。周期长度为 
m 的充要条件是，使尤= X Q = 0 的7?的最小正值是 n =爪。由关系式 （5) 和条件 
i )， 定理的证明便归结为证明如下 事实： 

引理 R 假定 l < a < p e ，其中 p 为素数，如果 A 是使得 U A - l ) l(a - 1)= 
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0( modulo p e ) 的最小正整数，则 



P 


e 


当且仅当 


a 


modulo p ) y 当 /> 〉 2 时 


a 


1( modulo 4) 


当 P 


2 时 


证明假设 ; I = 〆 ，如果 a 关 1( modulo 广），则当且仅当 


0( modulo p 


时， （/ - 1 )/(a - 1)=0 (modulo p e )。 于是，条件 


e 


0( modulo〆 ） 意味着 


e 


1( modulo p ); 但由定理 


p 


e 


(modulo /?)， 因此 a ^1 (modulo p ) 导致矛 


盾。如果 P 




2 和 


a 


3 (modulo 4)， 则由习题 8 有 


a 


2 


e 


1 


一 i)/( 


a 


_ l) 


这些论证说明，每当 



，时， 


般地必有^ 


0( modulo 2 e ) 

十妙/，其中少>2且 g 不是 p 的倍 



剩下要证明的是，这个条件对于导致 
P ， 可以发现对所有 g >0, 



，是充分的。通过重复地应用引理 




a 


1( modulo 


8 




a 


吴 1 (modulo p ^ 8 ^ 1 


因此， 


( a pR - l ) l(a - 1) = 0 (modulo p 8 ) 


a 


- \) l(a - l ) ^ 0 (modulo p 8 


( 6 ) 


+ 


特别是 


e 


0( modulo p e ) o 现在，同余序列 （0， a ， l ， 〆 ） 有 X 


n 


mod ，；因此，它有长度为 A 的周期，即当且仅当”是 A 的倍数时 


X 


n 


0 


o 


因此 〆 是 


的倍数 


仅当对于某个 


p g 时这才可能出现，而且关系 


式 （6) 意味着 A = //， 从而完成了证明。 

至此，定理 A 的证明即告完成。 
在结束本节之前，让我们来考察 


下 


C 


时纯乘法性生成程序的特殊情况 


x 


n + l 


aX n mod rrt 


尽管在这种情况下，随机数生成的过程稍微快些，但定理 A 说明了极大周期长度不 
ir 能达到。事实上，这是十分明显的。这是因为，现在这一序列满足关系式 

(7) 

而且 X , =0的值绝不会出现，以免这个序列退化成0。 一 般说来，如果 d 是 m 的任 

何因子，而且是^的倍数，则乘法性序列的所有随后的元素 x „ + 1 ，:^+ 2 ,…，都 

是 d 的倍数。所以当 c = 0 时，要求对所有的与 m 互素，而这就限制了周期 

的长度至多为，即0与 m 之间同 m 互素的整数个数。 

即使我们约定 e = 0, 仍有可能达到一个可接受的长周期。现在让我们来寻找 


关于乘数的条件，使得在这个特殊情况下，周期尽可能地长 


o 


根据引理 Q ， 当 m = 〆 时这个序列的周期完全依赖于诸序列的周期。我们来 


考虑该情况。我们有 X 


n 


mod /，显然，如果 a 是 P 的倍数，则这周期的长度 


将是1，所以我们取 a 与 p 互素。于是，周期是使得 X 0 = a A X 0 mod p e 的最小整数 
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A 。 如果 Xq 与 〆 的最大公因子是/，则这个条件就等价于 

a x = 1 (modulo p e ~^) (8) 

由欧拉定理（习题 1.2.4-28)， V (/_/) ^ l(modulo / _/ );因此 ， A 是 

cp { p e ' f ) = p e ~ f ~ l (p - 1) 

的一个因子。当 < 3 与 m 互素时，使 a x = l ( modulo m ) 的最小整数 A 通常称为 a 模 
m 的阶。 使模 m 的阶达到 最大的 a 的任何值称为模 m 的一个 本原元 （素）。 

设 A ( m ) 表示一本原元的阶，即模 m 的阶的极大值，则据上边的分析说明 
A (，）是， 4(^-1) 的一个 因子； 只须稍为留意（见以下的习题11 〜 16)，即可给出 

在所有情形下 A ( m ) 的精确值 如下： 

A (2) = 1， A (4) = 2, X (2 e ) = 2 f — 2 , 如果 e > 3 

Hp e ) = P e — '(P _ 1)， 如果 p > 2 (9) 

p e t <) = lcm (A ( ) , * * 1 , A ( /?/ )) 

我们的论述可以总结为下面的 定理： 

定理 B [ C . F . Gauss ，Disquisitiones Arithmeticse ( 1801 )，§90 〜 §92] 当 c =0 

时，可能的极大周期是 A U ) ，其中 A ( m ) 在式〈9) 中定义。如果 

0 X 。与 m 互素， 

ii ) a 是以 m 为模的本原元， 

则可实现这一周期。 ■ 

注意，如果 m 为素数，则可得到长度为 m -1 的 周期； 这恰恰比极大长度小1， 
所以，从实用的观点看，这样一个周期已有我们所期望的长度。 

现在的问题是怎样才能找到以 m 为模的本原元。这一节结尾的诸习题告诉我 
们，当 m 是素数或素数的幂时，有一个相当简单的答案，这即是在以下定理中所述 
的结果。 

定理 C 数 a 是以 p e 为模的本原元，当且仅当下列情况成立: 

0 p =2 ,e = l ， 且 a 是奇数•， 

ii ) p = 2 ，e 二 2,且 a mod 4 = 3; 

iii ) p = 2 ，e = 3, 且 a mod 8 = 3 ，5 或 7; 

iv ) p = 2， e >4, 且 a mod 8 = 3 或 5; 

v ) p 是奇数 y e = 1 ， a 吴0( modulo p ) ，而且对 p _ 1 的任何素因子 q , 吴 

1 (modulo p ); 

vi ) p 是奇数 ， e > 1 ， a 满足 v ) ，而且 i 舍 l ( modu\o p 1 ) 0 I 

对于充分大的 p 值，如果我们知道 p ~ I 的因子的话，通过使用 4.6.3 小节讨 
论的计算乘方的有效方法，很容易在一台计算机上检验这个定理的条件 v ) 和 vi )。 

定理 C 只可应用于素数的幂。但如果已给出模蚱本原 的值七 ，则采用在 

4 .3.2 小节中讨论的中国剩余算法，有可能找出一个 a 的值，使得 a 三 < 2 八 modulo 
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冲），1<_;<1而这个数 a 将是以 pi ” ••沁为模的本原元。因此，对任何适度大小的 

模数 m ，有一个相当有效的方法来构造满足定理 B 的条件的那些乘数，尽管这些计 
算在一般情况下是比较冗长的。 

在的普通情况下，上述条件简化成一个要求，即 a 三3或 5( modu ¬ 
lo 8)。 这时，所有可能的乘数的四分之一将使周期长度等于 m /4, 而当 c = 0 时， 
m /4 是可能的极大值。 

第二个最普通的情况是 772 = 10%应用引理 P 和引理 Q ， 不难得到在一台十进 
制的计算机上达到极大周期的必要和充分条件（参见习题 18): 

定理 D 如果 m 二 10 e ，e 彡 5 ，c = 0 且 X 0 不是2或5的倍数，则当且仅当 a mod 

200等于 下列32个值之一时，线性同余序列的周期是 5 x 1 CT _ 2 。 

3,11,13,19,21,27,29,37,53,59,61,67,69,77,83,91,109,117, 

123,131,133,139,141,147,163,171，173,179,181,187,189,197 | 1 


习 



1■[則具有 X 0 - 5772156648, a = 3141592621, c = 2718281829 ft m = 10000000000 的线性 


同余序列的周期长度是多少？ 

2.[10] 当 m 是2的一个乘幂时，下列两个条件是否足以保证极大长度的周期？ “（ i ) c 是奇 
数； （ ii)a mod 4 = 1 0 ” 


3. [73] 假设 m = l ( T ， 其中并进一步假设 r 是奇数，而且不是5的倍数。 证明： 当且仅 
当 a mod 20 = 1时，该线性同余序列有极大长度的周期。 

4. [ M 20] 假设 m = 2 e 和& = 0,如果数 a 和 c 满足定理 A 的条件，问的值是多少？ 

5. [ M ] 当 m = 2 35 + l 时，试求满足定理 A 的条件的所有乘数 a ( m 的素因子可从表3 .2. 1 . 1 
-1 中找到）。 



6. [20] 当 m = 10 6 - l 时，求出满足定理 A 的条件的所有乘数 a (见表 3.2. 1.1-1)。 

► 7.[ M 23] —个同余序列的周期不必以开始，但总能找到下标">0，/1>0,使得每当^7> 

( 1 时1 + ，而且//和 A 是具有这个性质的最小可能的值（参考习题 3.1-6 和习题 3.2. 1-1)。 

若 和心 是对应于序列 （ X。 mod pp , a mod p ) } , c mod py , ) 的下标，且 p 和 A 对应于合成序 

表 


列 （ X。， a , c ，抑…於），则引理 Q 指出， A 是 A t ，…，的最小公倍数。问如何借助于 y j ，…, 
示 p 的值？当固定时，通过改变 X Q ， a 和 q 可以得到的"的最大值等于多少? 


Mi 


S .[ M 20] 证明 ：如果 a mod 4 = 3, 则当 ^>1 时，(/叫 _ 1)/( a - 1)=0( modulo 2 e ) 0 (用引 
理 P 。） 

► 9.[ M 22]( W . E . Thomson ) 当 c = 0 和 m = 2 e >!6 时，定理 B 和 C 指出，当且仅当乘数 a 满足 
a mod 8 = 3,或者 a mod 8 = 5时周期的长度为2〃 2 。证明每个这样的序列在下列意义下，实质上 
是一个 m = 2〃 2 的满周期线性同余 序列： 

a ) 如果 X „ + 1 -(4 c + l ) X „ mod 2%而且 X ，, =4 Y „ + 1, 则 

Y n+ i = ((4 c + 1) + c ) mod If 一 1 

b) 如果 X n + i = (4 c - 1) X „ mod 2^ ， 而且 X,, = (( - 1) M (4 Y „ + 1)) mod 2 e ， 则 
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y , ! + 1 - ((1 -4 c ) Y „ - c ) mod 2^- 2 

[注 ：在 这些公式中， C 是一个奇整数。在文献中有过若干论断，意思是说，满足定理 B 且 

c = 0 的序列比满足定理 A 的序列更为随机，尽管在定理 B 的情况下它的周期长度只达到四分之 

一。 这一习题反驳了这样的 论断； 实质上，当 m 是2的幂时，人们必须拋弃字长中的两位，以节省 
对 c 的加法。] 

10. [ M 2]] 当⑺为什么值时，有 A ( m ) = p ( m )? 

► ll .[ M 28] 设 jc 是大于1的奇整数。 （ a ) 证明存在惟一的整数/>1，使得工三2^± Kmodulo 
2 /+1 )。 （ b ) 给定 l < i <2 e - l ， 而/是由 （ a ) 得到的相应的整数，证明： c 模 2 e 的阶是2〃、 （ c ) 特 
别是，这证明了定理 C i ) 〜 i v ) 。 

12. [ M 26] 设为一奇素数。如果 e > l ， 证明•.当且仅当 a 为以为模的本原元且耷 
l(modulo p 2 ) 时， a 也是以，为模的本原元。（在本题中，假设；1)。这个事实将 
在下面的习题14和16中证明。） 

13, [ M 22] 设是素数。若 a 不是以 p 为模的本原元，证明 ：或者 a 是 p 的倍数，或者对于 

整除 p ~ X 的某个素数 q ， a、 p - = 1 (modulo p ) 0 

U .[ M 18] 如果 ^>1 且 p 是一个奇素数，而且如果 a 是以 p 为模的本原元，证明 a 或者 a + 
是以，为模的本原元。[提 示： 见习题12。] 

15.[ M 29] ( a ) 设^，〜与 m 互素，并令它们模772的阶分别是和 A 2 。 如果 A 是；^和 A 2 

的最小公倍数，证明：对于适当的整数 / q 和 A ：2 ，有模777的阶 A 。[提示：首先考虑 ；l i 与 

互素的情况。] ( b ) 设 A ( m ) 是任何元素的模 m 极大阶，证明 A ( m ) 是每个元素模 m 的阶的倍数， 
即证明每当 a 与 m 互素时， a A ( —三 l ( moduk ) m ) 0 (不要使用定理 B 。） 

► 16.[ M 24] (原根的存在性） 设 p 是一素数。 

a ) 考虑多项式 /“） = / + q /- 1 +…+ r ，,， 其中诸 c 为整数。假定 a 是使得 / U ) 三 

0 (modulo p ) 的整数，证明存在一个整系数的多项式 gO ) = +…+ L - i ，使得对所 

有整数 ： c ，/(: r ) 三（工 — < 2 ) 9 (工 ） (modulo p ) 0 

b ) 设 /(: c ) 是如同 a ) 中那样的多项式，证明 f ( x ) 至多有 n 个模 p 的不同的“ 根”； 即，至多有 
n 个整数 a ((Xa < />) ，使得 /( a )=0 (modulo p ) Q 

c ) 由习题 15( b )， 多项式 /(: c ) = x A ⑺ -1 有户-1个不同的根，因此有一个阶为 p - l 的整数 

a 0 

17. [ M 26] 并非定理 D 中所列的值全都能通过文中的方法构造 出来； 例如，11就不是模 Y 本 
原的，但根据定理 D ， ll 是模 10 e 的本原元，试解释为什么会有上述结论？列在定理 D 中的那些 
值中，哪些同时是模2〃 和 y 这两者的本原元？ 

18. [ M 25] 证明定理 D (参考上题）。 

19. [40] 假定 c = 0, 试对列在表 3.2. 1 . 1-1 中的每个 m 的值，制作一张适当的乘数 a 的表。 

► 20.[ M 24]( G . Marsaglia ) 本题的目的是研究一任意线性同余序列的周期长度。令 Y , = 

1 + a 十…+ / - 1 ，使得对于由等式3.2.1-(8)得到的某个常数八，& = (46 + ：^)1110€1讲。 

a ) 证明〈 X 」的周期长度即是 〈 Y „ m 0 d 的周期长度，其中 m ' = m I gcd ( A ， m ) 。 

b ) 证明当 p 为素数时 < y ，, mod 〆 > 的周期长度满足下列条件 ：（0 若 a mod p = 则它为1。 

( ii ) 若 a mod p = 1 ，则它为 〆 ，但 /? = 2 和 及 a mod 4 = 3 时例外。 （ iii ) 若 /) = 2, e ^2 及 
a mod 4 = 3,则它是 a 模 〆 阶的两倍（参考习题11)，但 a 三 - 1 (modulo 20时例外，那时它为2。 
( iv ) 若 a mod /?>1，则它为 a 模 〆 的阶。 
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21.[ M 25] 在极大周期的一个线性同余序列中，令 X 0 = 0 和令 5 为使得 Y 三 l(modulo m ) 的 
最小正整数，证明 gcd ( X , ,772) = 50 

► 22.[ M 25] 试讨论求模 m ^ b k ± b l ±\ 的问题，使得习题 3.2.1.1-14 的带借位减法和带进位 
加法生成程序将有很长的周期。 

3.2. 1 .3 效能 在 3.2.1. 2小节，我们证明了，当 b = a - 1 是每一个整除 m 
的素数的倍数（且若 m 是4的倍数，则6也是4的倍数）时，可以达到极大周期。如 
果2是正在使用的机器的进制——对于一台二进制的计算机％ = 2,而对于一台十 
进制的计算机^ = 10——而且如果 m 是字大小/，则乘数 

a = z k + 1 y 2 k K e (1) 

满足这些条件。定理 3.2.1.2 A 也指出，我们可以取 c = l 。 现在有形如 

X n + x = (( z k + 1) X „ + 1) mod / ⑵ 

的递推关系，而且这个等式提示我们可以避免乘法，只须使用移位和加法就足够了。 

例如，假设“=召 2 + 1，其中3是 MIX 的字节大小，则代码 

LDA X ; SLA 2; ADD X ; INCA 1 (3) 

可用来代替在 3.2.1.1 小节中给出的一串指令，且执行时间从16“ 减少到 7 w 。 

由于这个原因，文献中对于具有形式 （1) 的乘数已广泛地进行了讨论，而且它们 
确实已为许多作者所推荐。然而，早年使用这个方法的经验表明，应该避免 （1) 中的 

简单形式的乘数，它所生成的数并不是很随机的。 

在这一章稍后，我们将讨论某个稍微复杂的理论，它解释被认为是坏的所有线 

性同余随机数生成程序为什么是坏的。然而，某些生成程序（例如 U )) 是非常糟的， 
一个比较简单的理论就可以把它否定掉。这样的简单理论，同“效能”的概念有关， 

我们现在就要来讨论它。 

具有极大周期的线性同余序列 的效能 被定义为使得 

b s 三 0 (modulo m ) (4) 

的最小整数 s (当乘数满足定理 3.2.1.2 A 的条件时，这样一个 整数 5 总是存在的， 
因为6是整除 m 的每个素数的倍数）。 

我们可以通过取 X Q = 0 来分析这个序列的随机性，因为0总要出现于这周期中 
的某处。在这个假定下，等式 3.2.1-(6) 简化为 X n = (( a fl - l ) db ) mod m ， 而且如 

果我们用二项式定理展开 a n - l={b + lY ~ 1，就得到 

= = + ) mod m (5) 

\ \ 2 / \s I I 

+ i 等等的所有项可忽略不计，因为它们是 m 的倍数。 

等式 （5) 是有启发性的，所以我们将考虑某些特殊情况。如果 a = 1，则效能是 
1;而且如我们已注意到的 ，尤三 modulo m )， 所以这个序列肯定不是随机的。 

如果效能为2,则有 = + A ^ 这个序列还不是很随机的。其实， 

x „ + 1 - X n 三 c + cbn 
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所以，在这一情况下，连续地生成的数之间的差以一种简单的方式从„的一个值变 
为下一个值。点（又„，；^ +1 ，；^ +2 )总是处于三维空间中的四个平面之一上： 

x -2 y+z = d ^ rm , x _2 y+z 二 d_m 

x - 2 y + z = d y 十 z = d_2m 

其中 d — cb mod m 。 

如果效能等于3,则这个序列开始时看起来更随机些，但在&，尤 + 1 和 X n + 2 之 

间有很强的相 依性； 检验说明，具有效能3的序列仍然不是十分好的。当效能为4 

或更大时，已经有关于其合理结果的报道，但其他人对此有不同看法。为了达到充 
分随机的值，似乎至少需要有效能5。 

例如，假设 m= 2 35 和 a=2 △十1。于是6 =2》，可见当々>18时，值 b 1 二 2 lk ^m 

的倍数：效能是2。如果々=17,16,…，12,则效能是3,而对于 A = 11，10,9,效能达 

到4。因此，从效能的观点看，可取的乘数仅有々<8。这意味着 a<257。 稍后我们 
将看到，也应避免小的乘数。因此当 m = 2 35 时，我们已经去掉了所有形如 2* + 1的 

乘数。 

当 m 等于 it； ± 1时（其中 w 是字大小）， m —般地不为素数的高次幂所整除， 

因而高的效能（见习题 6) 是不可能的。所以在这种情况下，不应当使用极大周期方 
法，而应当代之以应用 c = 0时的纯粹乘法的方法。 

必须强调的是，对于随机性说来，高的效能是必要的，但不是充分的。我们使用 

效能的概念仅仅是为了拒绝不起作用的生成程序，而不是用于接受起作用的生成程 

序。在线性同余序列的随机性被认为是可接受的之前，它们须通过 3.3.4 小节中讨 
论的“谱检验”。 


习题 

证明，不管 MIX 的字节大小 B 如何，代码 （3) 都提供具有极大周期的随机数生成程 

序。 

2. [70] 由 MIX 代码 （3) 所表示的生成程序的效能是多少？ 

3 . ⑴] 当 m = 2 35 时，具有 a =3141592621的线性同余序列的效能是多少？如果乘数是 a = 
2 23 + 2 13 + 2 2 + 1，则效能是多少？ 

4. [ i 5] 试证明 ：如果 m =2 f >8, 则当 a mod 8二5时，可达到极大的效能。 

5. [ M 20] 给定 m =抑…於，且 a = l + ，其中 a 满足定理 3.2.1.2 A 的条件，而且々 
与 m 互素，试证明效能是 maxCrq / Al , …， U / y :1)。 

► 6. [20] 在表 3.2.1.1-1 里 m = u ； ± 1的值中，哪个可用于产生其效能是4或更大的极大周期 
的线性同余序列（利用习题5的结果）？ 

7.[腳]当 a 满足定理 3.2.1.2 A 的条件时，它与 m 互素； 因此有一个数 ，，使 得 a ， 三1 
(modulo m ) 0 证明，可以简单地借助于6来表示。 

► 8.[ M 26] 由 X , ! + 1 = (2 17 + 3) X „ mod 2 35 和= 1所定义的一个随机数生成程序受到如下的 
检 验：设 ' sLiOAU 35 」； 则 y ，， 应是在0 〜 9之间的一个随机数字，且三元组 （ y 3 „, y 3ri + 1 , 
Y 3 „ + 2 ) 应该以相同的概率来取从（0,0,0)〜（9,9,9)这1000个可能值的每一个值。但用30000 
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个^的值进行检验时，某些三元组几乎不出现，而其它的三元组则经常比它们应有的出现次数要 
多。你能说明这个失误的原因何在吗？ 

3.2.2 其它方法 

当然，线性同余序列并不是被提出来供计算机使用的随机数的惟一来源。在这 
一 小节里，我们将考察其它一些最有意义的 方法； 其中有些是十分重要的，而另一些 
之所以引起我们的兴趣，主要是由于它们不像人们期望的那么好。 

同随机数生成相关联常见的谬误之一，是认为 ：为了 得到一个“甚至更随机”的 
序列，我们可以采取一个好的生成程序并对它略事修改。这往往是不正确的。例 
如，已知 

X n + i = ( aX n + c ) mod m (1) 

导致相当好的随机数，那么，由 

+ i = (( aX n ) mod ( t?z + 1) + c ) mod m (2) 

■ 

产生的序列是否更随机些呢？回答是，这个新的序列可能大大减少了随机性。因为 
整个理论破坏了，而且在缺乏任何关于序列 （2) 的特性的理论的情况下，我们进人了 
尤 + 1 =/( X „) 类型的生成程序的领域，其中函数/是随机地选 择的； 习题 3.1-11 〜 

3.1-15 说明，这些序列的特性大概都比由更受限制的函数 （1) 得到的序列差得多。 

我们来考虑另一种方法，以图获得对序列 （1) 的一个真正的改进。线性同余方 
法可以被推广成（比如说）二次同余 方法： 

X „ + 1 = ( dX 2 n + aX n + c ) mod m (3) 

习题 8 推广了定理 3.2.1.2 A ， 以得到有关 a , c 和 d 的必要和充分条件，这些条件使 
由 （3) 确定的序列的周期达到极大长度 m , 这些限制并不比线性方法更严。 

R . R . Coveyou 提出了当 m 是2的幂时的一个有趣的二次方 法：设 

X 0 mod 4 = 2, X ^ +1 = X n ( X n + 1) mod 2 \n ^ 0 (4) 

这个序列大约可以像 （1) 一样有效地来计算，而无须担忧会产生任何溢出。它同冯 
诺伊曼的原始平方取中法有着有趣的联系。如果设八为2又，即是通 过在& 

的二进表示的右边放上 e 个0而得到的一个双精度数，于是八 + 1 恰好是由+ 

的中间 h 个字组成！换句话说， Coveyou 方法几乎等同于一个稍微退化的双 

精度平方取中法，而且它保证有长周期，在习题8的答案中所引用的 Coveyou 的论 
文中证明了它的随机性进一步的证据。 

还可考虑等式 （1) 的其它推广。例如，我们可以试图扩展这个序列的周期长度。 
一个线性同余序列的周期是相当 长的； 当 m 近似于计算机的字长时，通常得到10 9 
阶的或更高阶的周期，因而在计算时通常仅仅使用这个序列非常小的一部分。另一 
方面，在 3.3.4 小节中讨论有关精确度的思想时，我们将看到，周期长度影响着一个 
序列可以达到的随机性程度。因此，有时希望探求一个更长的周期。有许多方法都 
可做到这一点。有一项技术是让& + 1 依赖于尤和；^^，而不仅仅依赖于 X n; 这 
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样，周期的长度可以高达州 2 。因为这个序列在 （ X „ + A ， X „ + A + 1 ) = d ， X „ + 1 ) 之前 

不会开始重复。 John Mauchly 在 1949 年提交给一个统计会议而未发表的一篇论文 
中，使用递推 关系人 等于 （Xf 取中，推广了平方取中方法。 

& + 1 依赖于前边一个以上的值的最简单序列是斐波那契 （ Fibonacci ) 序列 

X n + 1 = ( X , + X „_ i ) mod (5) 

人们在20世纪50年代初就考虑过这个生成程序，而且它给岀的周期长度常常大于 
772;但是检验表明，由斐波那契递推关系 （5) 所产生的数的随机性肯定不能令人满 
意，所以现在对以关系 （5) 作为随机数来源的主要兴趣在于，它构成了一个很好的 
“坏例子”。我们还可以考虑当》有比较大的值时，形如 

X n + y = ( X n + X n - k ) mod m (6) 

的生成程序。 Green ， Srmth 和 Kkm 对此作过介绍 [JACM 6 (1959) ， 527 〜 537 ]， 他 
们报告说，当 M 5 时，这个序列没能通过 3.3.2 小节所述的间隔检验，尽管当々 = 
16时，检验是令人满意的。 

1958年 G . J . MitcheU 和 D . P . Moore 想出了一个好得多的加法生成程序（未发 
表），他们提出由 

X n - ( X 77 — 24 十 X ”— 55 ) mod m , n ^ 55 (7) 

定义的稍微不寻常的序列，其中 m 为偶数，…， X 54 是不全为偶数的任意整数。 

在这个定义中，常数24和55不是随机地选择的，它们是特殊的值，它们碰巧定义了 
最低有效二进位值〈尤 mod 2> 的周期长度正好是2 55 -1的一个序列。因此，序列 

〈又〉 必定有至少这样长的一个周期。习题30说明，当 m 二 r 时，式 （7) 有长度为 
2〃 t (2 55 - l ) 的周期。 

乍一看，等式 （7) 似乎对于机器实现极不适合，但事实上使用一个循环表就可非 
常有效地生成这个序列。 

算法 A (加 数生成程序） 开始时 ，内 存单元 7[1]， Y [2]， …，7 [55] 分别置成 
值 X 54 ， X 53 ，…， X Q ，j 开始时等于 24 j 开始时等于 55。 本算法的逐次实施将产生 

数 X 55 ， X 56 ，…作为输出。 

A 1. [加](如果这时我们正要输出尤 ， Y [7] 现在等于 X „_ 24 , YU ] 等于 

X ,- 55 o)g Y [ k ]^~( Y [ k ] + Y [ j ]) mod 2% 并输出 Y [ k ] 0 
A 2. [前进] j 和々减1。如果现在 j =0,则置 j —55, 否则如果々=0,则置 

厶 <_ 55。 | 

在 MIX 中这个算法简单地写为如下的程序 A 。 

程序 A (加 数生成程序） 假定变址寄存器 5 和 6 代表 j 和都不为包含这个 
子程序的程序的其余部分所触及，下面的代码实施算法 A 并把结果留在寄存器 A 
中。 

LDA Y , 6 A !. 加 
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ADD Y , 5 (可能溢出） 

STA Y , 6 — Y k 

DEC 5 1 A 2. 前进。 j 勺 ■ - 1 

DEC 6 1 k^k — 1 

J 5 P ^ + 2 

ENT 5 55 如果 j 二 0, 则置 j — 55 

J 6 P * + 2 

ENT 6 55 如果 A =0, 则置 A —55 


这个生成程序通常比我们前边讨论过的方法要快些，因为它不要求任何乘法。除 
了速度外，它还具有我们见过的最长的周期，但在习题 3.2.1.2-22 中例外。其次，如 
Richard Brent 已经发现的，可以把它弄成对于浮点数也能正确地工作，而避免在整数和 
分数之间的转换（见习题23)。因此，在实际应用中它很可能被证明是非常好的随机数 
来源。难以毫无保留地推荐序列 （7) 的主要原因是，只有很少理论来证明它们是否具 
有所需的随机 性质； 实际上，我们所确知的是这个周期非常长，而这是不够的。然而 
John Reiser (斯坦福大学博士论文， 1977) 已经证明，假定某个似真的猜测为真，则像等 

式 (7) 这样的加法序列将在高维中很好地分布(请见习题26)。 

(7) 中的数 （24 ，55)通常称 做延搁 （ lag )， 由 （7) 所定义的数构成了延 搁的斐 

波那契序列。 以下某些习题中提供的理论结果证实，像（24,55)这样的延搁很有效。 
当然，当一个应用碰巧在一个时刻使用比如说55个值的组，则使用稍微更大的延搁 
要更 好些； 由 （7) 所生成的数将肯定没有严格地处于又„— 24 和 X „_ 55 之间的 X , 7 (见习 


题2)。 J .- M . Normand , H J . Herrmann 和 M . Hajjai ■在进行要求 10 l M 

精度蒙特卡罗方法的详尽研究时发现，由 （7) 所生成的数的稍微偏离[ 


随机数的高 


.Statistical 



Physics 52 (1988) ,441 




446]; 但是很大的々值减少了坏的效果。表1列出了若干 


有用的 （/，々 M 禹。对于这些值偶来说 ，I 


(X 


/ + X 


mod 2 e 有周期长度2 


(2^ -1)。对于大多数应用说来，（/，々）= (30,127) 的情况应是足够大了，特别是和 
我们后面将要讨论的其它增强随机性技术相结合之后。 


表1产生长周期模2的延搁 


(24,55) 

(37,100) 

(83,258) 

(273,607) 

(576,3217) 

(7083,19937 〉 

(38,89) 

(30,127) 

(107,378) 

(1029,2281) 

(4187,9689) 

(9739,23209) 


对于本表的扩充，请见 NL Zieler 和 J ‘ Brillhart Jnformaiion and Control 13 (1968) ， 541 〜 554 ， 14 (1969) ， 566 〜 
569, 15 (1969) ， 67 〜 69; 粟田良舂 (Y. Kurita) 和松本真 （M . Matsuraoto) ， Math. Comp. 56 (1991) ， 817〜821 ; 
Heringa ， Bl6te 和 Compagner, Int• J• Mod. Phys, C3 (1992) ， 561 〜 564 


George Marsaglia [ Comp . Sci . and Statistics : Symposium on the Interface 16 

(1984),3 〜 10] 建议以 

X T , - ( X„_24 * x „_ 55 ) mod m , n > 55 (7” 

来代替 （7)。 其中 m 是 4 的倍数，而 Xo 到 X 54 是奇数，不全同余于 1( 模4)。于是 
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次低有效位有2 55 -1的周期，而最高有效位比以前更彻底地混杂在一起。因为它们 
以一种基本方式依赖于乂„_ 24 和 X „_ 55 的所有二进位。习题31表明序列 （70 的周 

期长度只是比 （7) 的周期长度稍短一点点。 

自1958年以来延搁的斐波那契生成程序已被成功地使用于许多情况，因此当 
在1990年发现它们实际上不能通过对于随机性的一个极其简单的非针对性的检验 
时，确实引起了震动（请见习题3.3.2-31)。在本小节接近结尾处描述了通过丢弃序 
列的适当元素而避免这样的问题的解决方案。 

不用纯粹的加法和纯粹的乘法的序列，我们可以通过对 小的& 取；^，…， 

& — 的一般线性组合来构造有用的随机数生成程序。在这种情况下当模 m 是很 

大 的素数 时出现最好的 结果： 例如， 772 可以选择成可装入一个计算机字的最大素数 

(见表 4.5. 4-2)。 当 m = p 是素数时，有限域理论告诉我们，有可能来求乘数以， 
…， a k ，使得 

= ( 〜尤 ― i + …+ a k X n _ k ) mod p (8) 

所定义的序列有周期长度/- I ;这里 X Q ，" •，&^可以任意选择但不全为 0( 特殊 

情况々=1对应于一个具有素数模的乘法同余序列，这是我们已熟悉的）。当且仅当 
多项式 

fix) — x k - a x x k ~ x - ■•- - a k (9) 

是一个“模 A 本原多项式”时， S 卩，当且仅当这个多项式以有 〆 个元素的域中的一个 
本原元作为根时，式 （8) 中常数 …，…， a k 有所希望的性质（见习题4.6.2-16)。 

当然，对于实际应用来说，仅仅假定有适当的常数 〜，…， a k 使周期长度为 〆 - 

1，这是不 够的； 我们必须有能力来找到它们，而且我们不能简单地尝试所有 〆 个可 
能性，因为 P 有计算机字长那么大的阶。幸而，，…，〜）恰有 cp ( p k - \)ik 种适 

当的选择，所以在做了一些随机的试验之后，有相当好的机会选中一个。但是我们 
也需要有一种方法能迅速地告知 （9) 是否是一个模 > 本原多 项式； 逐个生成这个序 
列的/- I 个元素并等候出现重复肯定是不可想像的！在 Sa/iichyS A26 (1964)， 
305〜328中， Alanen 和 Knuth 讨论了检验模 p 本原性的一些 方法； 可以使用以下的 

准则：令 r^(p k ~ l)l(p - l)o 

i ) (~ l ) k ~ l a k 必定是模 p 原根（参考 3.2.1.2 小节）。 

ii ) 多项式/必然同余于 （-1) 卜 1 〜，模/( I )和 p 。 

iii ) 利用模 f 多项式算术，对于 r 的每个本原因子 g ， x rlq mod /( x ) 的阶必定为 
正数。 

4 . 6 . 2小节中讨论了利用模给定素数 p 多项式算术，计算多项式 f mod fix) 
的有效方法。 

为了进行这个检验，需要知道 r = ( 〆 -1)/( / - 1) 的素因子分解，而在计算中 
这是一个限制因素；当々=2,3或许4时， r 可在相当时间内被分解，但当充分大 
时，更高的々值就难于处理了 。 A = 2 实际上已把 A = 1可以达到的“有效随机数字” 
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个数增加一倍，所以很少有必要取更大的 A 值。 

修改后的谱检验 (3.3. 4小节）可用来估价由 （8) 生成的数的 序列； 见习题 3.3. 4 

-24。该节的考虑表明，当该形式的本原多项式存在时，我们不应做 q = +1或 -1 

这样明显的 选择； 最好挑选大的、实质上“随机的”满足条件的^，…， 以的值 ，并应 

用谱检验来验证这个选择。求 q ，…， a , 涉及相当大的计算量，但所有已知证据表 

明，其结果将是随机数的非常令人满意的来源。我们实质上只用单精度运算就实现 
了有 A 倍精度的一个线性同余生成程序的随机性。 

特殊情况 p = 2 有独特的意义。有时，希望有这样一种随机数生成程序，它仅仅 

产生一些二进位-些0和一些1——的随机序列，而不是一个介于0和1之间 

的小数。有一个简单的办法，通过 A 个二进位字的操作来生成一台二进计算机上的 
高度随机的二进序 列：从 一个任意的非0二进字 X 开始。为了得到这个序列的下一 
个随机位，进行（以 MIX 语言表示的）下列操作（见习题 16): 

LDA X (假设现在溢出开关是“关闭”的） 

ADD X 左移一位 

JNOV * + 2 如果高位原来为0则转移 (10) 

XOR A 否则以“异或”来调整这个数 

STA X | 

这里第四条指令是“异或”操作，几乎所有的二进计算机上都具备（参考习题 2.5-28 
和 7.1 节）；它改变 rA 中与单元 A 中每一个为“1”的位对应的位的状态。单元 A 中 
的值是二进常数（以_-以） 2 ，这里 x k - a , x k ~ x a k 是如上所说的模2的本原多 

项式。在执行代码 （10) 后，所生成的序列的下一位可取作 X 的最低位，或者也可以 
总使用 X 的最高位，如果最高位更方便的话。 


例如，考虑图1，它说明了对于 1G11 

=4, CONTENTS ( A ) = (0011) 2 生成的 0101 

1010 

序列。当然，这里 A 的值非常小。右 0111 

边的列表示这个序列的位顺序，它以 1110 

长度为/ - 1 = 15的周期重复 ， gp 1111 

1101011110001001…。考虑到它是仅 nG1 

由内存的四个二进位生成的，这个序 

列是十分随机的。为了看出这一点， 0010 

考虑出现于周期中的相邻四位组，即 0100 

1101，1010, 0101, 1011, 0111，1111， 1000 

1110 , 1100 , 1000 , 0001 , 0010 , 0100 , 0011 

0110 

1001,0011，0110。因为周期的长度恰 11CK) 

为 Y -1， 一般地说，除了全0的组之 10 u 


外，每个可能的相邻々位组在周期中 图1在二进方法中计箅机字 x 的逐个 
都恰好出现一次；所以相邻的々位组 的内容，假设且 CONTENTS ( A ) = (0011) 2 
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实质上是独立的。我们将在 3.5 节中看到，当々为30或更大时，这是一个非常强的 
随机性准则。 R . C . Tausworthe 在一篇论文中从理论上说明了这个序列的随机性 

[ Math . Comp . 19 ( 1965 ) ,201 -209] 0 

W . Stahnke 编制了模2的次数<168的本原多项式表 [Mark Comp . 27 (1973) , 
977〜980]。当々 = 35时，我们可以取 

CONTENTS ( A ) = (00000000000000000000000000000000101 ) 2 

但习题18和 3.3.4-24 告诉我们，最好还是找出定义模2本原多项式的实质上“随 
机”的常数。 

正告： 若干人曾经误认为本随机位生成技术可以用来生成随机的全字长的小 
数，（.乂。叉 1 — &_ 1 ) 2 ，（.足* +广_；^」） 2 ，〜 ； 但这实际上是随机小数的一个拙劣 

的来源，尽管这些位个别地是十分随机的！习题18说明了为什么如此。 

Mitchell 和 Moore 的加法生成程序 （7) 实质上是以本原多项式的概念为基 础的； 
多项式 x 55 + : r 24 + l 是本原的，而且表1实质上是所有模2本原三项式的一张表。 
几乎和 Mitchell 和 Moore 的这个生成程序相同的生成程序独立地为 T . G . Lewis 和 
W . H . Payne 于1971年所发现 [JACM 20 (1973) ,456〜 468] ，但用的是“异或”而不 

是加法，使得周期恰为2 55 - 1。在他们的序列中，每个二进位都跑遍同样的周期序 
列，但有各自的起始点。经验表明， （7) 给出更好的结果。 

我们现在已经看到，当是&，…，&^的适当函数和当 m 是素数时，可以 

不太费劲就构造出且周期为1的序列。不难看出，由形如 

X , = / Un ，" •，尤-々），0 < X , < m (11) 

的关系定义的任何序列的最高周期是 m k 0 M . H . Martin [ Eu / i . Amer . Math . Soc . 40 
(1934)，859 〜 864] 首先证明了 ：对于 所有的 TTz 和 t 达到这个极大周期的函数都是 
可能的。他的方法容易叙述（见习题17)，而且对于编写程序也相当有效（见习题 
29)，但不适合于随机数的生成，因为它非常缓慢地改变+…+ 的 值：所 

有的々元组都出现，但并非以很随机的顺序。习题21考虑了产生极大周期的更好 
的函数/的类。一般说来，相应的程序不如我们已经描述过的其它方法那样有效地 
生成随机数。但是如果整体来考虑周期，它们确实具有很明显的随机性。 

随机数生成的许多其它方案已经被提了岀来。在这些可选择的方法中最让人 

感兴趣的可能是由 Eichenauer 和 Lehn 所提出的逆同余序列 [St a tistische Hefte 27 

(1986),315-326] 

X , + 1 = (^ zX ； 1 + c ) mod p (12) 

这里 > 是素数， X „ 取遍集合丨0，1 ，…， p - l ， m 丨，而逆由0 — 1 = M ，⑺ — 1 二0,否则 

X~ l X = l ( modulo />) 来定义。由于在这个序列中0后面总是跟随着 00 而后跟着 C ， 
因此从实现的目的考虑我们可以简单地定义0 _1 =0;但当0^ =⑺时在理论上更清 
晰也更易于发展。适合于硬件实现的有效算法可利用来计算 X - 1 modulo 比如 
说，请见习题4.5.2-39。但不幸的是这个运算不是大多数计算机的保留节目。习题 
35说明， a 和 c 的许多选择产生长度为 p + l 的极大周期。习题37显示了重要的性 
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质：逆 同余序列完全没有格 （ lattice ) 结构，而格结构正是线性同余序列的特征。 

另一类重要的技术涉及随机数生成程序的 组合。 总有那样一些人，感到线性同 
余方法，加法方法，等等，都太简单了，给不出充分随机的序列；而且也许永远无法证 
明，他们的怀疑是不正确的——确实，他们可能是对的——因此争论这一点确实毫 
无用处。有相当有效的方法来把两个序列组合成第三个序列来。它应是足够杂乱 
的，几乎能令最坚定的怀疑论者满意。 

假设我们有在0和 m _ 1之间的两个随机数序列，…和 Yq ， ，…，最 

好是由两个无关的方法生成。于是，如同 M . D . MacLam 和 G . MarsagUa 所建议的那 
样 [JACM 12 (1965),83 〜89;也可见 Marsaglia 和 Bray,CACM 11 (1968)，757〜 

759]，我们可以用一个随机序列来排列另一个的元素。 

算法 M (通 过洗牌实现随机化） 给定生成两个序列 〈 XJ 和〈的方法，本算 

法将逐个地输出“颇为更随机”的序列的项。我们使用一张辅助表 v [0], 

-1], 其中 A 为某个适当选择的数，通常在100左右。开始时，以 X 序列的头々 

个值来填 V 表。 

Ml . [生成 X ， Y ] 置 X 和 Y 分别等于序列 〈尤〉 和〈八〉的下一项。 

M 2. [抽取 j ] 置 j — 爪」，其中 w 是用于序列中的模，即•/是一随 

机值，它由 Y 确定。 

M 3 .[交换]输出而后置 — X 。 ■ 

作为一个例子，假定把算法 M 应用于以下两个序列，且々 = 64。 

X 0 = 5772156649, X n + 1 = (3141592653 X , + 2718281829) mod 2 35 

(13) 

Y 0 = 1781072418, y „ + 1 = (2718281829 + 3141592653) mod 2 35 

凭直觉，看来可以保险地预测，通过应用算法 M 于 （13) 上所得到的序列实际上将满 
足任何 人对于计算机生成的序列的随机性要求，因为输出的邻近项之间的关系几乎 
完全被抹掉了。而且为生成这个序列所需要的时间仅仅比单独生成序列所花 

时间的两倍略多 一 些而已。 

习题15证明 ：算法 M 输出的周期长度，从实用考虑，在大多数情况下，将是 
和 〈 yj 的周期长度的最小公倍数。特别是，如果当值0出现在 Y 序列中我们 

就拒绝它，使得〈 八〉 有2 35 - 1的周期长度，则从 （13) 通过应用算法 M 生成的数有 

长度为2 70 _ 2 35 的周期[请见 J . Arthur Greenwood , Comp . Sci . and Statistics ： Symp . 
on the Interlace 9 (1976),222]。 

然而，有一个更好的方法来洗一个序列的元素，它是由 Carter Bays 和 S . D . 

Durham 发现的 [ACM TVans . Math . Soft ㈣ re 2 (1976) ， 59 〜 64] 。他们的方法尽管 

看起来同算法 M 十分类似，而且只要求一个输入序列而不是两个，但是可给出 
令人惊异的更好的性能。 


算法 B (通过洗牌实现随机化） 给定生成序列 〈 XJ 的方法，这个算法像算法 M 
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一样利用一个辅助表 v [ o ]， v [ i ]， …，-1]，逐个地输出“颇为更随机的”序列 
的项。开始时，用 X 序列的头 々个值 来填满 V 表，而辅助变量 Y 置成等于第々+ 1 
个值。 

B1. [抽取置 L 々 Y /^ n 」， 其中饥是用于序列 〈 X „〉 的模，即 j 是由 Y 确 

定的一个随机值， ( XjCA 。 

B2 .[交换]置 Y — V [ j ]， 输出 Y ， 而后置 V [ j ] 为序列〈尤〉的下一元素。 ■ 


做一下习题3和习题5,以便对算法 M 和算法 B 之间的差别有一些感性认识。 
通过取々等于字节大小，在 MIX 上我们可以实现算法 B 。 一旦已经完成了初始 

化，即可得到以下简单的生成方案： 

LD 6 Y ( l ： l ) 7的高阶字节 

LDA X rA ^ X n 


INCA 1 
MUL A 

STX X 


(参考习题 3.2.1.1-1) 
rX-X n + 1 

‘‘ n — /2 + 1 ” 


(14) 


LDA V ，6 

STA Y Y ^ V [ j ] 

STX V ,6 V [ j ]^ X n I 


输出在寄存器 A 中。注意，对于每个生成的数，算法 B 仅要求四条指令的开销。 
F . Gebhardt [Ma th . Comp . 21 (1967) ， 708 〜 709] 发现，即使把算法 M 应用于像 

斐波那契序列这样非随机的序列，并取 = Pernod m 和八 = F 2 „ + 1 mod m ， 算法 

M 也可产生出令人满意的随机序列来。然而，如果像习题3中所示那样，和 

〈八>是密切相关的话，算法 M 也可能产生出不如原来序列那样随机的序列。对于 

算法 B 似乎不会引起这样的问题。因为算法 B 不使任何序列减少随机性，而且由于 
它可能以非常小的额外代价增强随机性，故可以推荐它和任何其它的随机数生成程 

序组合在 一 起使用。 

然而洗牌的方法有一个固有的 缺点： 它们只改变所生成数的顺序，而不是数的 
本身。对于大多数的目的而言，顺序是关键的事，但如果一个随机数生成程序不能 
通过在 3.3.2 小节中讨论的“生日间隔”测试或者习题 3.3.2-31 的随机漫步测试， 
那么在洗牌之后，其际遇也不会更好。洗牌还有一个相对的缺点，即它不允许我们 
在周期中的一个给定位置开始，或者对于很大的々，从迅速地跳到； 

因此许多人已经建议以简单得多的方式来组合两个序列 〈 xj 和 〈 y „>。 它可以 

避免洗牌方法的这两个缺点：当 m 且 ( XY / mXm 时，我们可以使用 

像 

Z n - ( X n - Y n ) mod m (15) 

这样的组合。习题13和14讨论了这样的序列的周期长度；习题 3.3.2-23 证明，当 
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种子（初始值） X Q 和％独立地选定时， （15) 趋向于增强随机性。 

去掉算术生成数的结构性偏倚的一个甚至更为简单的方法，在计算的早期岁月 

就已由 J . Todd 和 O . Tausshy Todd 提出 [ Symp . on Monte Carlo Methods ( Wiley , 

1956)，15 〜 28]: 我们能够把序列中的某些数扔掉。他们的建议对于线性同余生成 
程序用途不大，但同像 （7) 这样有极长的周期的生成程序相关联，就变得十分合适 

了，因为我们可丢弃大量的数。 

改进 (7) 的随机性的最简单的方法是对于某个小的7，仅使用每第7项。但是一 
个更好的方案，它甚至也更简单，是使用 （7) 来产生，比如说，在一个数组中的500个 
随机数，而且仅仅用它们中的头55个。在消耗了这55个数之后，我们用同样的方 
法再产生500个。这个思想是在动态系统中的混沌理论的激励之下，由 Martin 

LUscher 提出的 [Computer Physics Communications 79 (1994) ， 100 〜 110] 。我们可 

以认为 （7) 是把55个值 （尤 _ 55 ，…， XrO 映射到55个值 （X … — 55 ,…， X „ + ；!)的 

另一个向量的过程。假定生成了 ^>55个值并使用其中的头55 个； 那么如果 z = 
55,则这个新的值向量稍微接近于旧的，但如果 r 〜500,则在旧的和新的之间几乎 
就没有关联了（见习题33)。事实上，对于带进位加和带借位减的生成程序的类似 
情况（习题 3.2. 1.1-14)，这些向量已知为一个线性同余生成程序中的数的^进表 
示，而且在某个时刻当我们生成〖个数时相关的乘数是纟关于这一情况的 

Luscher 理论因此可通过 3.3.4 小节的谱检验得到证实。基于经 Liischer 方法增强 

了的斐波那契延搁系统产生的一个可移植的随机数生成程序，出现于 3.6 节，并附 
有进 一 步的评述 一 '起给出。 

随机数生成程序一般只要做少量的乘法和/或加法就能从序列的一个元素得到 
下一个。当把这样的生成程序同上面建议的组合在一起时，普通常识告诉我们，得 
到的序列应当是同真正的随机数没有区别的。但是直观的预感不能代替严格的数 
学证明。如果我们愿意做更多的工作——比如说，是现在工作的1000倍或1000000 
倍那么多——我们就可以得到这样的序列，对于它们，可以有对随机性好得多的理 

论保证。 

例如，考虑由 

X ” + 1 二 Xl mod M B n = X 71 mod 2 (16) 

生成的二进位 4 , 52 ,…的序列 [Blum 和 Shub , S/COMP 15 ( 1986 ) ，364 〜 383 ] ，或 

者由 

X n + 1 = X 2 n mod M B n = X n • Z mod 2 (17) 

生成的更复杂的序列，其中 r 位二进数 （ A - r " JC Q )2 和 （ A - i … 2： q ) 2 的点乘乘积是 

+…十 azo ; 这里 Z 是一个 r 位的“屏蔽” （ mask ) ，而且 r 是 M 中的二进位 

数。模 M 应是形如4^+3的两个很大素数的乘积。而且起始值应该同 M 互 

素。由 Leonid Levin 所建议的规则（17)，是从冯诺伊曼原来的平方取中法出发的; 
我们称它为平方搅混法 （ muddle-square method ) ，因为它把平方的二进位搅混。规贝 1 J 

(16) 当然是 Z =1 的特殊情况。 
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3.5 F 小节包含这样一个证明，即当和 M 是随机选取的时，由 （16) 和 （17) 

所生成的序列通过关于随机性的所有统计检验，所需工作都不会多于对大数的因子 
分解。换句话说，当 M 足够大时产生的二进位数，今天最快的计算机计算100年也 
算不出其与真正的随机数有什么分别，除非可以找到更快的方法求出这种数的非平 
凡因子。式 （16) 比 （17) 要简单些，但是如果我们要想达到相同的统计保证，则 （16) 
中的模 M 必须比 （17) 中的更大些才行。 

习题 

► l .[ i2 ] 在实践中，我们利用 X ,, + 1 = ( aX „ + c ) mod W 来形成随机数，其中诸 X 是整数，然后 
把它们处理成小数 U n = Xjm 。 U” 的递推关系实际上是 

L/,, + 1 二 (aU n + elm) mod 1 

利用计算机上的浮点算术，试讨论直接利用这个关系的随机序列的生成。 

► 2.[ M 20] —个好的随机数源大约有六分之一的时间有因为，，和 

X ，, + 1 的六种可能的相对次序的每一种应当是同等可能的。然而，试证，如果使用斐波那契序列 
(5)，则上述次序绝不出现。 

3 . [23 ] (a) 如果 X 0 = 0,X n+1 = (5X„ + 3) mod 8 ， Y 0 = 0， + L = (5 Y” + 1 ) mod 8, 且是 = 4, 
则算法 M 将生成什么序列？（注意，因为效能为2 ,所以和〈 O 开始时不是极端随机的。) 
( b ) 如果把算法 B 应用于同一个序列 〈 XJ 且々=4,则会发生什么情况？ 

4. [00] 为什么用于程序 （14) 的头一行是最髙位字节，而不是其它字节？ 

► 5.[20] 试讨论在算法 M 中利用 Y ； 来改进生成的速度。结果类似于算法 B 吗？ 

6 . [10] 正文指出，在二进方法 （10) 中，如果反复地执行这段程序，则 X 的低位是随机的。为 
什么不是整个字 X 是随机的？ 

7. [20] 试证 ：如果 把程序 （10) 改成 如下： 

LDA X LDA A JNOV * + 3 XOR A 

JANZ * + 2 ADD X JAZ -x- + 2 STA X | 

则可得到长度为 Y 的全序列（即，在周期中， 2〃 个可能的 e 个相邻位组的每一个，恰恰出现一次）。 

8. [ M 39] 证明： 二次同余序列 （3) 有长度 w 的周期，当且仅当下列条件 成立： 

i ) c 与 m 互素； 

ii ) 对于所有整除 m 的奇素数 p 和 a - 1都是 的倍数 •, 

iii) 如果 m 是 4 的倍数，则 d 是偶数，而且 d = a - 1 (modulo 4) •，如果 m 是 2 的倍数，贝 1 J d = a - 

1 ( modulo 2) ; 

iv ) 如果 m 是 9 的倍数，则 (modulo 9) 0 

[提 示：由 乂。= 0，又, + 1 =狀 2 „ + ^„ + 6模 W 定义的序列有长度为772的周期，仅当同一个序 
列模 w 的任何因子 r 有长度为 r 的周期。] 

► 9.[ M 24]( R . R . Coveyou ) 利用习题8的结果证明 ：修改 的平方取中法 （4) 有长度为2〃 2 的周 
期。 

10. [ M 29] 证明 ：如果 心和&不全为偶数，且 m =2 € ，则斐波那契序列 （5) 的周期是 3 X 

- } 

厶 o 
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ll .[ M 36] 这个习题的目的是分析满足递推关系 

X„ = a l X” _ 丄 + …+ a k X n — k ， k 

的整数序列的若干性质；当 /> 是素数时，如果我们能计算这个序列模 w 〆 的周期长度，则关于 
汪意模 m 的周期长度，是对于 m 的诸素数幂因子的诸周期长度的最小公倍数。 

a ) 如果 /( z )， a ( z ),6( z ) 是整系数的多项式，且对于某些整系数多项式 W U )， wU )， 有 

a { z) — b(z) + f( z) u ( z) + mv ( z ), 则我们写 模 /( 2 ：) 和 m )。 证明当 / (0) = 1 和 

p-:>2 时，下列命题成立 ：如果 d 三 1( 模 / U ) 和 〆 ） ，^异 1( 模/⑺和， +1 )，则 / = 1 (模 f(z) 
和， +1 )，/尝1(模 / U ) 和 p e + 2 ) 0 

b ) 设 f(z) 二 1 — a { z ~ **■ - a k z k , E . 

G(z) = \l f(z) = A 0 + A[Z + A 2 z 2 + ■■- 

令 A (7?2) 表示 〈An mod m 〉 的周期长度，证明 A (? n ) 是使得/‘三以模/( 2 ：)和 w ) 的最小正整数 A 。 

c ) 给定素数 p ， 妒 >2且2(，）7^(// +1 )，证明对于所有 r >0 ，A (广 卜，;1( 〆 ）。(因此为 
求序列 〈 A „ mod 20 的周 期长度，可以计算 A (4 )， A (8), A (16)， …， 直到求出使得 A(WA ⑷的 

不小于3的最小6值；于是对于所有的 g 即可定出模2〃 周期长度。习题 4.6.3-26 说明当 n 很大 
时如何用 0 (log n ) 步操作计算 X . o ) 

d ) 证 明：满 足在本题开始时提出的递推关系的任何整数序列，对于某个整系数多项式 g(z), 
有生成函数 g(z)lf(z) 0 

e ) 设 d ) 中的多项式 / U ) 和 gU ) 对于模 p 互素（参照 4.6.1 节），证明序列 mod 有和 
^中的特殊序列 〈 A ，, mod ，〉完全相同的周期长度。（不管如何选择 Xq ，! ，都不可能得到 
更长的周期，因为一般的序列是特殊序列的“移位”的线性组合。）[提示 ：习题 4.6.2-22( Hens e l 引 

理）表明：存 在多项式使得 a ( z)f(z) + b(z) g(z)^l( modulo p e ) o] 

► 12. [ M 28] 求整数和 c ， 使得序列 

\ + 1 = ( aX n + bX T1 - ! + c ) mod 2、 n \ 

在这种类型的序列中有最长的 周期。 [提示：由此得出 ，尤 + 2 二 （U + 1 ) + ! + (b - a)X n ~ 

bX n . x ) mod 2、见习题 11 c )。] 

13. [ M 20] 设 〈 D 和〈是整数模 m 的序列，且周期长度为 At 和 A 2 。 通过令= ( X r) + 
VJ mod m 把两者组合在一起。证明，如果 Ai 与 A 2 互素，则序列〉的周期长度是 A ! A 2 。 

14. [ M 24] 设； C 。， 如上题所述。假定 At 的素因子分解为 2〜3 W _ •，类似地， 
■頁设 ， 令 心，如果〜参八；否则为0)，而且令 A 0 二 2~3〜5。证 
三 与亨列〈&〉的周期 A ' 是、 的倍数，而且它是的一个因子。特别是，如果对于每个 
素数 p ，4#/ p 或 〜 = / p = 0, 则 〆 = A 。 

15. [ M 27] 设算法 M 中的序列 〈 O 有周期长度 Ai ，并假定它的周期的所有元素都不同。令 

1 ；_ ^ mml r I r >0 且 一 J m } = L 々 Y,,/w 」 I o 假定对于所有 n^-n 0 , q n < ，且序列〈 ^ 〉有周 

罕长度 A 2 。设 A SAi 和 A 2 的最小公倍数，证明由算法 M 产生的输出序列〈乙>的周期长度是 A 。 

► 16. [ M 28] 设在二进记法下，方法 （10) 中的 CONTENTS ( A ) 是 （ fll a 2 ） 2 。证明低阶二进位 

-V , X L ，…的生成序列满足关系 

x „ 二 + a 2 X ”_ 2 + … + a k X n - k ) mod 2 

:这可以看成是定义序列的另一种方法，尽管乍一看来，这个关系式和有效代码 （10) 之间的联系并 

7三弓显！] 
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17 . [ M 33 ] ( M . H . Martin ,1934) 设 m 和々为正整数，并令 A = X 2 =…= 0。对于所有 
”>0,令& + *为小于讲的最大非负值3；，使得々元组 （ X ,, + 1 ，…，未曾出现于这序列 
中； 换言之，对于 0< r < n , (尤 + 1 ，…，尤 + ,, — " 30 必须不同于 （ X r+1 ，…，；0 + + )。这样，每个可能 
的々元组在序列中至多出现一次。当我们达到这样 一个〃 值，即对于所有非负的 ^< m ,( X , + 1 , 

…，乂^卜！，3；)在这个序列中已经出现，则这个过程结束。例如，如果 m = k =3,则这个序列是 

00022212202112102012001110100 

而且这个过程结束于此。 U ) 证明当这个序列终止时，有 — + （ b ) 证明，满足 

的每个1元组（~，〜，… ，〜） 都出现于序 列中； 因此当 n ^ m k 时，序列终止。[提 示：对 
5 用归纳法，证明当 a s ^0 时（〜，…， a ,，0, …， 0) 出现。]注意，如果对于定义 f ( X n , 
…，卜0 = ；^^，并置 X ^ o =0, 则我们得到一个有极大周期的函数。 

18. [ M 22] 设〈 X ”〉是以々=35和 CONTENTS ( A ) = ( 00000000000000000000000000000000101 ) 2 

由方法 （10) 生成的二进位序列。命 R 为二进小数 + + 试证这个序列 〈 U ,,〉 

当 d = 8 时不能通过对偶的连续检验 （3.3.2 B 小节）。 

19. [ M 41 ] 对于 4.5.4 小节中表2头一列中所确定的每个素数 p ， 求岀如同正文所建议的适 
当常数〜，〜，使得当 k 二1 时，式 （8) 的周期长度是 p 2 - 1。（例子见等式3, 3. 4-(39)。） 

20 . [ M 40 } 对于2<々<6 4 ,试计算适合于用作方法 （10) 中的 CONTENTS ( A ) 的常数，并且要有 
和那些数差不多一样多的0和1的个数。 

21.[ M 35]( D . Rees ) 正文说明了怎样求使得序列 （11) 的周期长度为 m k - I 的函数/，假定 m 
是素数，且 X 。，不全是0。证明 ：这样 的函数可修改，以得到对于所有 w ， 周期长度为^ 

的类型 （11) 的序列。[提 示：考 虑习题7和习题13的结果，以及像〈从 2 ，,+ &，, + 1 〉这样的序列。] 

► 22.[ M 24] 正文把推广线性序列 （8) 的讨论限定于 w 是素数的情况。证明当 m “无 平方，，时， 
即⑺是不同素数的乘积时，也能得到相当长的周期。（检查表 3.2.1.1-1 可以看出 ， m = w ± l 经 
常满足这个 假设； 因此正文的许多结果都可以运用于这种情况，这对于计算更方便。） 

► 23.[20] 作为不同于式 (7) 的一种选择，讨论由 X W -( X ^ 55 - X „_ 24 ) mod m 所定义的序列。 

24 . [ M 20 ] 设0</<1证明 ：当由 y „ = ( y , ; _ / + y ,.,) mod 2 定义的序列有周期长度？― 1 

时，由递推式 + mod 2所定义的二进位序列也有同样的周期长度。 

25. [26] 试讨论程序 A 的一种变例，每当第55次要求一个随机数时，它改变 Y 表中的所有 
55个表项。 

26. [ M 48]( j . F . Reiser ) 设/>是素数并设々是整数。给定整数 ai ，…，〜和〜，…， a ，令 A a 
是由递推式 

— x n mo d p a ,0 n < k \ X n 二 ( a 上 _ 丄十… + a k X n _ k ) mod p a , n ^ k 

生成的序列〈 X ,,〉的周期，并设 N a 是在这个周期中出现的 0 的个数（即使得 •<〜 + A a 且' 

= 0的下标 j 的个数），试证明或否定下列 猜测： 对所有 a 和所有^，…，^，存在一个常数 c (可能 
依赖于和6及〜，…，〜）使得 N a < cp a(k - 2)l(k - l) 0 

[注： Reiser 证明，如果这个递推式有模 p 极大周期长度（即如果 A i = /- I )，且如果这个猜 

测成立，则当 a — oo 时的々维差将是 OUV _ a / U _1 ))。 于是，当 m =2 e 和考虑整个周期时， 

像 （7) 这样的加法生成程序将在55维中很好地分布（关于在6维中差异的定义见 3.3.4 节）。这 
个猜测是很弱的情况，因为如果〈 X ,,〉差不多同样经常地取每个值，且如果 

a 增加时，量 JV a 〜（ 〆 -1)//) 根本不增加。 Reiser 对于々 = 3已经验证了这个猜测。另一方面，他 
已经证明，假定 1) 及々>3且 a 充分大，则有可能找到异常坏的开始值 n ，…，々 
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(同 a 有关），使得 N 2 a >p a o] 

27 . [ M 30 ] 假设把算法 B 应用于周期长度为 A 的一个序列 〈 D ， 其中；证明对于固定 
的々和所有充分大的 A ， 这个序列的输出最终将是周期的且有相同的周期长度 A ， 除非 〈 XJ 在开 
始时不是非常随机的。[提示：找出 Ul / m 」 的连续值的一个模式，该模式能引起算法 B “同步”它 


随后的特性。] 

28 . [40 ] ( A . G . Waterman ) 以 m 为计算机字大小的平方或立方，而 a 和 c 为单精度数，试实 
验线性同余序列。 

► 29. [40] 只给定々元组（:^，…，；），试求出计算习题17中由 Martin 的序列所定义的函数 

，: Ca ) 的一个好方法。 

30. [ M 37]( R . P . Brent ) 令 / U ) = / _ 1 - a k 是模2本原多项式，并假设 X 。 ，…， 

&^是不全为偶数的整数。 

a ) 证明对于所有递推式 = + …+〜尤 mod 2 e 的周期是 1 (2 A - 1 ) ， 

当且仅当 + A — /( 上 ） 2 + /( — ：0 2吴 2( - 1) 》 /( — / )( 模 8) 。[提示：我们 

有工 2 三 - ： r (模4和 /(：0)当且仅当 + ~ 工） 2 ^2/(了 2 )(模8)。] 

b ) 证明当多项式 f ( x ) = x k ± W ± 1是模2本原的且 A >2时，这个条件总成立。 

31. [ M 30 ]( G . Marsaglia ) 当 m = 时序列（7 7 ) 的周期长度是多少？假设心，…， X 54 不全 


都模8同余于± 1。 

32. [ M 2]] 当 X „=( X , t _ 24 + X „-55) 


mod m 时子序列〈〉和〈 X 3 ,, 〉的兀素满足什么递推 


式？ 

► 33. [ MZ 3 ] ( a ) 令 ( 之）=+ 30 + X ” + 2 9 之 + …十 + X, l + 54 z 31 + …十 X ” + 31 z 54 ，其中诸 

X 满足延搁的斐波那契序列（7)。试求 gri (2〉 和 t + JO 之间的一个简单关系。 （ b ) 借助于 X 0 , 

…， X 54 来表 7 K X 5 ooo 

34 . [ M 25 ] 证明逆同余序列 （12) 有 p + i 的周期，当且仅当多项式 /(: c ) = ： r 2 - c 2：- fl 有以下 
两个性质 ：（ i ) 当以模 /) 多项式算术进行计算时 ，: mod /( jc ) 是一个非零 常数； （ ii ) 对于每一个 

整除 p + l 的素数 q f x (f,+ [)lq mod / U ) 有度数1。[提 示：考 虑矩阵 P ^的乘幂。] 


35 . [ HM 35 ] 有多少数对 U ， c ) 满足习题34的条件？ 

36 . [ M 25 ] 试证明逆同余序列 X „ + l -( aX ； 1 + c ) mod 2 e ，二 1，，每当 a mod 4 = 1 和 
c mod 4 二 2 时，有 2〃 1 的周期长度。 

► 37 . [ HM 32 ] ^ p 是素数并假定;^ + 1 = ( aX ； { + c ) mod p 定义周期为 f + 1 的一个逆同余序 
列。还设 — 并考虑集合 

V = l ( x , + A ，尤+~，…，； C , + 〜且对于/叫 

1 2 a j 

这个集合包含 p + 1 - d 个向 fl ， 其中的任何 d 个位于某 U - 1) 维超平面 H = i ( TM ，…，仏) 
r [ v l + ■•- + r d v d - r 0 (modulo />)1 中，其中 （ n ，…， rj 吴(0, …， 0)。试证 V 中没有 d + 1 个向量 
位于相同的超平面中。 


3.3 统计检验 

我们的主要目的是得到一些序列，它们的特性好像是随机的。至今，我们已经 
看到怎样使序列的周期长到在实际应用中绝不出现重复；这是一个重要的准则，但 
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是它并不意味着这样的序列在应用中保证是有用的。那么，如何判定一个序列是否 
充分地随机呢？ 

如果给某人笔和纸，要求他写下100个随机的十进数字，则他写出令人满意的 
结果的机会是十分微小的。人们倾向于避免似乎是非随机的一些事情，例如相等的 
两个相邻数字(尽管每十个数字中大约有一个应等于它的前面的数字）。而且，如果 
我们给某人一张真正随机数字的表，则他十分可能告诉我们，它们全然不是随 机的； 
他的眼睛将看出某些表面上的规律性。 

根据 I. J . Matrix 博士 （Martin Gardner 摘 录于 Scientific American , 1965年 1 月） 

的说法，“数学家把 7T 的十进制展开当做是随机序列，而对于一个现代数值逻辑学家 
说来，它有极丰富的值得注意的模式。”例如， Matrix 博士指出，在 7T 的展开式中头一 
次重复的两位数字是26,而它的第二次出现是在一个奇妙的重复模式 中间： 

3.14159265358979323846264338327950 

丫 丫 Y vy 丫 丫 ( 1 ) 

在列出许多位数字或它们的其它性质之后，人们就会发现，如果正确地解释的话， 7T 
可以反映人类经历的整个历史！ 

人们都会注意自己的电话号码、执照号码等的模式，以帮助记忆。这些陈述都 
集中到一点，就是我们不能自信地去判定一个数列是否随机。因此，必须应用某些 
无偏倚的机械检验。 

统计学理论为我们提供了随机性的某些定量的测度。可以想像到的检验多得 
不胜 枚举； 我们将讨论那些已经证明是最有用、最有效益和最易于为计算机计算所 
釆用的检验。 

如果一个序列对于检验 T lf T 2 ，…， T n 有随机特性，那么一般我们不能保证，当 

施以下一个检验7\ + 1 时，它不致惨遭 失败； 不过，每一次检验都越来越增强我们关 

于序列的随机性的信心。实践中，我们应把五六个不同类型的统计检验用于一个序 
列上，如果它都令人满意地通过了这些检验，则我们就认为它是随机的——在证明 
有罪之前，宜于假定是无辜的。 

应该对每一个要广泛使用的序列都进行细心的检验，所以下列各节说明怎样以 
正确的方式进行这些检验。要区别两种类型的检 验：经 验检验，即让计算机来处理 
序列中出现的数组，并计算若千统计量；理论检验，即使用以形成该序列的递推规律 
为基础的数论方法，来确定序列的特性。 

如果根据还不够充分，则读者可以尝试 Darrell Huff 的 How to Ue With Statis¬ 
tics (Norton, 1954) 一 书中所介绍的一些技术。 

3.3.1 研究随机数据的一般检验方法 


A • 义 2 检验 
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/检 验也许是所有统计检验中最著名的，而且在与许多别的检验 


一起使用时，它是一个基本的方法。在一般地考虑这个方法之前，先来考虑 X 2 检验 
的一个特例，即应用于掷骰子的情形。利用两个“真正的”骰子（假定它们每一个都 
独立地以同样的概率指示1，2,3,4,5或6)，以下给出了一次投掷得到给定总和 s 的 

概率： 


s 的值= 2 
概率 ， A 


3 

4 

5 

6 

7 

8 

9 

10 

11 

12 


1 

1 

1 

5 

1 

5 

1 

1 

1 

1 

(1) 

18 

12 

9 

36 

6 

36 

9 

12 

18 

36 



(例如，4的值可以三种方式掷成：1 + 3,2 + 2,3+1;这组成了盖=&，即36种可能 
结果中的 p A0 ) 

如果掷骰子 n 次，则平均说来得到值 s 的次数近似于 nA 。 例如，在144次投掷 

中，我们将得到值4大约12次。以下说明了在144次投掷的具体序列中真正得到 
的结果是 什么： 

s 的值= 2 3 4 5 6 7 8 9 10 11 12 

观察的数，1 = 2 4 10 12 22 29 21 15 14 9 6 (2) 

期望的数，= 4 8 12 16 20 24 20 16 12 8 4 

注意，观察的数在所有情况下都不同于期望 的数； 事实上，随机地拋骰子从来难 
得恰好以正确的概率 出现： 掷骰子144次，有36 144 个可能的序列，它们全都有同等可 
能。这些序列之一由所有的2组成（“对么”，两点），而且任何人如果一连串掷岀144 
次对么，则可以确信这骰子装铅了。但如果我们列出每次投掷每个骰子的结果的 
话，则全是2的序列将同任何特定的序列具有完全相同的可能性。 

由此看来如何能检验岀给定的骰子有没有装铅呢？回答是，不可能做出一个确 
定的是否判断，但可以给出一个概率的回答，即我们可以说某些事件是如何地可能 
或不可能的。 

处理上面的例子的一个相当自然的方式，是考虑观察数 I 和期望数之间 
差数的平方。我们可以把这些平方加在一起，得到 

V = ( Y 2 — np 2 ) 2 + (y 3 - np 3 ) 2 + …+ ( Y 12 - n Pn ) 2 (3) 


坏的骰子应当得到相对高的 V 值； 而且对于任何给定的 V 值，我们可以问，“使用 

真正的骰子时， V 这样高的值的概率是什么？”如果这个概率很小，比如说我们 

就知道，在100次中仅有一次将给出同期望数如此背离的结果，这样我们就完全有 
了猜疑的理由。（不过请记住，即使是好的骰子，100次中也会有一次给出这样高的 
V 值，所以一个细心的人，应再次重复这个检验，看看这个高的 V 值是否再现。） 

式 (3) 中的统计 V 对于 （ y 7 - n /> 7 ) 2 m ( Y 2 - np 2 ) 2 给岀相等的数，尽管 （ y 7 - 

n Pl ) 2 可能要比 （ Y 2 - np 2 ) 2 高得多，因为7的出现次数大约是2出现次数的6倍。 
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所以，“正确”的统计（至少已证明为最重要的一个统计）将对 （ Y 7 - nh ) 2 仅仅赋予 
相当于 （ Y 2 - nh ) 2 的 i 重要性，而且我们将把 (3) 换成下列公式 


V = 



— np 2 ) 
np2 




- np 3 ) 
np 3 




^12 - ^Pn) 2 


(4) 


这就是所谓在这个掷骰子的实验中，观察量 Y 2 , …， Y 12 的 X 2 统计。对于 (2) 中的数 
据，我们得出 


V = 




(6 - 4) 2 


4 




48 


(5) 


现在重要的问题当然是“7 g 是否是 V 不可能取到的高值呢？”在回答这个问题以 
前，让我们考虑；^方法的一般应用。 

一 般地说，假设每个观察可以落人々个范畴之一。我们作 n 个独立的观察。 
这意味着，一次观察的结果必然对于任何其它次的结果绝无影响。设久是每次观 

察落人范畴 s 的概率，并设是 真正落 人范畴 s 的观察数，于是我们形成统计 


k 

V = S 

5=1 


(V, - np s ) 2 

np s 


( 6 ) 


在上面的例子中，每次掷骰子共有11种可能的结果，所以々 = 11。[等式 （6) 是由等 
式 (4) 稍作改动得到的，因为我们把可能性编号改为1 至々 以代替从2至12。] 

展开⑹中的 （ Y 5 - 峨) 2 = 7?-2/2/^ 5 +?/^，并利用事实 


Y\ + Y 2 + ### 十匕 =” 
+ 户 2 + ••• + Pk ^ ^ 



得到公式 



该式通常使 V 的计算稍容易些。 

现在我们回到重要的问题：“什么是 V 的一个合理的值？”这可以通过参考表1 
这样的表来求得，表1对于各种 V 的值给岀“自由度 V 的;分布”的值。要使用表 
中 v = 1 的行； “自由度”的数是6 -1，比范畴数小1。（直观地看，这意味着 Yi ， 

，…， h 不完全独立，因为 （7) 表明，如果 Y 2 ,-, n 已知，则 A 即可计算 出来; 
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因此，有1个自由度。这个论证是不严格的，但是下面的理论可以证实它。) 

表1 分布的选定的百分值 



p = 1% 

p = 5% 

产 25% 

p = 50% 

p - 75 % 

p = 95% 

产 99% 


■■■ 


■IB 

MBM 

1.323 

3.841 

6.635 



MESM 

0.5754 



KB 

mm 




1.213 



7.815 

11.34 

u = 4 

0.2971 

0.7107 

1.923 

3.357 

5.385 

9.488 

13.28 

v-5 

0.5543 

1.1455 

2.675 

4.351 

6.626 

11.07 

15.09 

v = 6 

0.8721 

1.635 

3.455 

5.348 

7.841 

12.59 

16.81 

V-1 

1.239 

2.167 


6.346 

9.037 

14.07 

18.48 

i^ — 8 

1.646 

2.733 

5.071 

7.344 

10.22 

15.51 

20.09 

y = 9 

2.088 

3.325 

5.899 

8.343 

11.39 

16.92 

21.67 

V = 10 

2.558 

3.940 

6.737 

9.342 

12.55 

18.31 

23.21 

p - 11 

3.053 

4.575 

7.584 

10.34 

13.70 

19.68 

24.72 

u = 12 

3*571 

5.226 

8.438 

11.34 

14.85 

21.03 

26.22 

v = 15 

5.229 

7.261 

11.04 

14.34 

18.25 

25.00 

30.58 

u -20 

8.260 

10.85 

15.45 

19.34 

23.83 

31.41 

37.57 

v 二 30 

14.95 

18.49 

24.48 

29.34 

34.80 

43.77 

50.89 

v - 50 

29.71 

34.76 

42.94 

49.33 

56.33 

67.50 

76.15 

u>30 

v + V 2vx p 1 2) xp 3 + 0( l/VT ) 

x p~ 

-2.33 

—1.64 

-0.674 

0.00 

0.674 

1.64 

2,33 

更多的值见 ML Abramowitz 和 I . A. Stegun 编的 Handbook 0 / Mathematical Functions (Washington t D. 

C. : U. S. Government Printing Office, 1964), 表 26.8, 也见式 （ 22) 和习题 16 


如果表中第 f 列第 P 行的项是 X ，则它意味着“如果72充分大，式 （8) 中的量 V 
将以大约^的概率小于或等于: T ”。 例如，第10行的95%那一列的值是 18.31 ，这就 
是说，将仅有5%的次数取 V >18.31 0 

现在让我们假定，利用某个假设是随机数的序列，在一台计算机上模拟上述掷 
骰子实验，得到下列 结果： 

5 = 2 3 4 5 6 7 8 9 10 11 12 

实验 1，1=4 10 10 13 20 18 18 11 13 14 13 (9) 

实验 2， Y ； = 3 7 11 15 19 24 21 17 13 9 5 

在第一种情况下，可以计算/统计，得到 V ^29 而在第二种情况下，则得到 
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v 2 = l ^。 参考表中自由度为10的项，我们看到 K 太高； V 大约只有1%的机会 

大于 23.21! (通过使用更详尽的表，可以发现事实上 V 仅有0.1%的机会这样 
高。）因此，实验1表 7 K 了对随机特性的重大偏离。 

另一方面， V 2 十分小，因为在实验2中\十分接近于 (2) 中的期望值 np s 。 x 1 

表告诉我们， V 2 的值太低了 ：观察 的值竟如此接近于期望的值，我们不能认为这结 

I 

果是随机的！（其实由其它的表可见， V 的这样低的值，当自由度是10时，仅有 

0.03%的机会。）最后， （5) 中计算的值 V = 7 g 也可以用表1进行校验。它落在 

25%和50%的表项之间，所以不能认为它是过于高或过于 低的； 根据这个检验， （2) 
中的观察是令人满意地随机的。 

值得注意的是，不管 n 的值是什么，也不管概率 A 是多少，都使用同一张表中 

的值。只有数 p = 对结果有影响。但是实际上，这张表的值不是绝对正 确的: 

f 分布是仅对足够大的 n 值才正确的一个近似值。 那么，72应该多大呢？ 一个经 
验规则是把 72 取得充分大，使得每个期望值 n 久是5或 更大； 而更可取的是，取的 72 

比这大得多，以得到更强有力的检验。在上面的例子中，我们取72 = 144,所以 

仅为4,结果违背了上述的“经验规则”。这只是由于作者厌倦掷骰子而造 成的； 它 
使得表 1 中的项对于我们的应用来说不大精确。在一台计算机上，以 72 = 1000 或 
10000或甚至100000来进行这个实验，将比这好得多。我们也可以把和5 = 
12的数据合并在 一起； 于是，这个检验将仅有9个自由度，但/的近似将更精确。 

通过考虑仅有两个范畴、其概率分别为 h 和 p 2 的情形，我们可以得知所涉及 


近似的粗略程度。假设户 



和 p 2 



4 


o 


按所述经验规则，为了得到一个令人满 


意的近似，应当有72>20。让我们来检验一下。当/2=20时，对于-5<「<15,7 


可能的值是 （ Yi - Sp / S + O - h ) 2 /^^ 2 。 我们希望知道表1的 v = l 行对 V 

的分布的描述好到什么程度。 f 分布连续地变化，而实际的 V 分布则有稍大的跳 
跃，所以，为了表示确切的分布我们需要某些约定。设这个试验的（可能是不同的） 
结果分别以概率 7 T 。 ， 7 Ti ，…， 7 T „ 导致值，假设给定的百分比 p 落 

入范围 TTo + …+ 7T ; _ ! < p< 7T Q +…+ 7T J - 1 + 7T ; o 我们将通过“百分比点 ” l 来表示 

>，使得 V 小于： C 的概率小于等于/)，而大于工的概率小于等于 1- /)。不难看出， 
惟一^这样的数是： c = Vy 。 在/ 2 =20和 V = 1 的例子中，结果是，当/> = 1 % , 5 % , 

25%,50%，75%，95%，99%时，与表1中的近似值相应的精确分布的百分比点分别 

为（精确到小数点后两位） 

0， 0， .27， .27， 1.07， 4.27， 6.67 

例如4 = 95%时的百分比点是 4. 27,而表1给出 3.841 的估计。后一个值 太低； 它 
(不正确地）告诉我们以95%的水平拒绝值 V = 4.27, 而事实上 V >4.27 的概率大 
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于6.5%。当72=21时情况稍有变化，因为所预期的值 77^=5.25 和 72/)2 = 15.75 

绝不可能精确地得到 ; n =21 的百分比点是 

.02， .02, .14, .40, 1.29, 3.57, 5.73 

当 n =50 时我们期望表1是更好的近似，但对应的值实际上在某些方面比^二 
20更远离表1: 


.03, .03, .03, .67, 1.31, 3.23, 6 

以下是 72 = 300时 的值： 

0，0， .07, .44， 1.44, 4 , 6.42 

在这种情况下，甚至在每个范畴中， n 久 >75时，表1的表项也仅好到大约一位有效 

数字。 

n 的适当选择是不大容易办到的。如果骰子实际上是有偏倚的，则当72越来越 
大时，即可发现这一事实（参照习题12)。但是当具有一个很强倾向的数区紧跟有 
一个相反倾向的数区时，很大的 n 值将倾向于平滑掉局 部地非 随机的行动。当转动 
实际的骰子时，局部的非随机的行动并不是一个问题，因为贯穿于整个检验使用的 
是同一个骰子。但是由计算机生成的数的一个序列却可能很清楚地显示这样的异 
常性。或许应该对若干个不同的 n 值来做 f 检验。无论如何，72总是应该稍大些。 

我们可以将？检验总结如 下：做 相当多 （ n ) 次独立的观察。（重要的是，除非 
观察都是独立的，否则就避免使用？方法。例如，拿习题10来说，它考虑的是当观 
察的一半依赖于另一半时的情况。）我们计算落人 A 个范畴中的每一个观察数，并 
计算式 (6) 和 (8) 中给出的量 V 。然后对于 V = A - 1，把 V 同表1的数进行比较。 
如果 V 小于1%那列的值或大于99%那列的值，则我们拒绝这个数并认为它是不 
够随机的。如果它处于1%和5%的表项之间或95%和99%的表项之间，则这些数 
是“可疑 的”； 如果（通过插值） V 在5%和10%的表项之间，或90%与95%的表项之 
间，则这些数可能是“几乎可疑的”。 X 2 检验通常至少要对不同的数据组进行三次， 
而且如果在三个结果中至少有两个是可疑的，则这些数即被认为是不够随机的。 

例如，图2说明了对六个随机数序列的每一个应用五种不同类型的？检验的 
结果。图中每个检验被应用于这序列的数中三个不同的块区。生成程序 A 是 Ma - 
cLaren - MarsagUa 方法（算法 3.2.2 M 应用于3.2.2_(13)中的序列），生成程序 E 是 

斐波那契方法， 3.2. 2-(5)，而其余的生成程序是具有下列参数的线性同余 序列： 

生成程序 B ： X 0 = 0 ,a =3141592653, c = 2718281829, m - 2 35 o 

生成程序 CiXo ^ O ,^ =2 7 + l，c = l，m = 2 35 。 

生成程序 D ： X 0 = 47594118 ， a =23， c =0 ,m = 10 8 + 1。 

生成程序 F ： X 0 = 314159265 ， a = 2 18 + 1 ， (： = 1 ， m = 2 35 。 

由图 2 可以作出结论(仅就这些检验来说），生成程序 A ， B ， D 是令人满意的，而生成 
程序 C 处于两可之间，因而大概它将被拒绝，生成程序 E 和 F 肯定不能令人满意。 
当然，生成程序 F 效能低。生成程序 C 和 D 已在文献中讨论过，但它们的乘数太 
小。（生成程序 D 是 Lehmer 于1948年提出的原始乘法生成 程序； 生成程序 C 是 

•41 • 


第 3 章随机数 


A B C D E F 



■ 


■ 

■ 





■ 






■ 

□ 

□ 


■ 


■ 

■ 


H 



■ 





■ 

■ 

■ 

□ 

■ 

■ 




■ 






■ 




□ 

□ 

□ 

■ 



BI 

■ 

■ 

■ 

□ 


■ 



■ 

■ 

■ 

□ 

□ 

■ 


■ 

H 

■ 




■ 


■ 

■ 

■ 

■ 

H 


□ 

□ 

□ 


F 的范围 指示 代码 


0%~1%，99%~ 100% 

1% 〜 5% ， 95% 〜 99% 
5%~10%, 90%-95% 


拒绝 
可疑 

几乎可疑 o 



图2在90个/检验中的“显著”偏离的图示（参看图 5) 

Rotenberg 于 1960 年提出的 c#0 的原始线性同余生成程序。） 

除了用“可疑”、“几乎可疑”等等作为判断 f 检验结果的原则外，还有一个不那 
么专用的方法可资利用，我们将在这一节的稍后部分来讨论它。 


B . Kolmogorov - Smirnov 检验我们已经看到，当观察可以落人有限的 々个 范畴 
时，即可应用/检验。然而，考虑可以取无限多个值的随机量，例如随机分数（即0 
和1之间的一个随机实数）的情况也不鲜见。尽管在计算机里只能表示有限多个实 
数，但我们希望随机值本质上具有[0，1)中的随机实数的特性。 

不论概率分布是有限的还是无限的，有一种统一的描述方法普遍地用于概率和 
统计的研究中。假设要描述一个随机量 X 的值的分布，我们可以借助分 布函数 
FU ) 来做，其中 

F(j:) - Pr(X = (X^x) 的概率 

图3示出了三个例子。首先，我们看到一个随机二进位的分布函数，即在 X 仅取两 

个值0和1的情况下，每一个有概率图 3( b ) 部分显示了在0与1之间一 致地分 

布的随机实数 的分布 函数； 这里当 时， 的概率简单地就等于: c ， 例如 

的概率自然为 I "。而图 3( c ) 显示了在/检验中值 V 的极限分布(这里以10 

个自由度来表示）；我们已经看到这个分布在表1中以另一种方式表不。注意，当 ： c 
从— oo 变到+ °°时， F () 总是从 0 增加到 1 。 

如果我们对随机量 X 做 n 次独立观察，由此得到的值，则可形 


成经验分布函数(: r )， 即 


F n ( 


小于或等于工的…，的数目 



( 10 ) 


n 


图4示出了三个经验分布函数（呈锯齿形，尽管严格说来垂直线并不是尺（^)图的 
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图 3 分布函数的例子 


一部分），叠印在假定的实际分布函数 F (: T ) 的图上的情况。当72充分大时， F n U ) 
将越来越好地近似于 F ( x)o 



( a ) ( b ) ( C ) 


图 4 经验分布的例子 

当 FU ) 没有跳跃时，可以使用 Kolmogorov - Smirnov 检验 （ KS 检验）。该检验 

是以 FU ) 与 F „( x ) 之间的 差为基础的。坏的随机数生成程序给出不太近似于 

FU ) 的经验分布函数。在图 4( b ) 的例子 中 足一直太高，所以经验分布函数就太 

低。图 4( c ) 给出了一个甚至更坏的例子；很明显，匕 U ) 和 FU ) 之间这样大的偏 

离是极不可能的， KS 检验能告诉我们这种不可能性的程度。 

为进行 KS 检验，我们构造下面的统计： 
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K ； 

= max 

(F n (x) - F(x)) 



- OO < O ： < + 

OO 

(11) 

K ~ 

—n max 

- < x < + 

(F(x) - F n (x)) 

OO 



这里 K : 度量当大于 F 时的最大偏离量，而度量当 P ； 小于 F 时的极大 
偏离。对于图4的例子的统计是 



图 4( a ) 

图 4( b ) 

图 4( c ) 


K 2 + o 

0.492 

0.134 

0.313 

(12) 

K 2 o 

0.536 

1.027 

2.101 



(注 ：出 现于式 （11) 中的因子最初可能使人感到莫名其妙。习题6说明，对 

于固定的： c ， F „( x ) 对 F ( x ) 的标准偏离与 1/ vQ 成比例；因此，的作用是放大统 

计量与，以使这个标准偏 离与” 无关。） 

和在？测试中一样，我们现在可以通过在“百分比”表中考察和，来确 

定它们是否特别高或特别低。对于和 K ；：， 表2均可用于这个目的。例如， 

小于或等于 0.7975 的概率是75%。与％ 2 检验不同，这个表中的项不仅仅是”充 
分大时的近似值;表2给出了精确值（当然舍入误差除外），因而对于任意的”值 KS 

检验都能可靠地使用。 

表2分布和 K ；： 的部分百分比点 



p = 1% 

户 = 5% 

p-25% 

/> = 50% 

p = 75% 

p = 95% 

p = 99% 

n = 1 

0.01000 

0*05000 

0.2500 

0.5000 

0.7500 

0.9500 

0.9900 


mm 

0.06749 

0.2929 

msm 

mmm 

10980 

1 ■ 2728 


mm 

wmm 

mem 

mem 

0.7539 

mmm 

1.3589 


0.01943 

0.08789 

0.3202 

msm 


1.1304 

mEm\ 


0.02152 

0.09471 

CL 3249 

0.5245 

0.7674 

M392 

1 • 4024 

n = 6 

0.02336 

0.1002 

0.3272 

0.5319 

0.7703 

1.1463 

1.4144 

n-1 

0.02501 

0.1048 

0.3280 

0.5364 

0.7755 

M537 

1,4246 

n-S 

0.02650 

0*1086 

0.3280 

CL 5392 

0.7797 

11586 

1.4327 

n-9 

0.02786 

0.1119 

0.3274 

0.5411 

0.7825 

1.1624 

1.4388 

n = 10 

0.02912 

0.1147 

0.3297 

0,5426 

0*7845 

1.1658 

1,4440 

n = \1 

0.03028 

0.1172 

0.3330 

0.5439 

0.7863 

1.1688 

1■4484 

n = 12 

0.03137 

0.1193 

0.3357 

0.5453 

0.7880 

1.1714 

1.4521 

n = 15 

0.03424 

0.1244 

0.3412 

0.5500 

0.7926 

1.1773 

1 . 4606 

n =20 

0.03807 

0.1298 

0.3461 

0.5547 

0.7975 

1.1839 

1.4698 

n = 30 

0.04354 

0.1351 

0.3509 

0.5605 

0*8036 

: L 1916 

1.4801 

n>30 

y p - 1/(6 \l~n ) + 0(l/n )， 其中： y p — 之 ） n ( "( 1 P )) 

yp = 

0.07089 

0.1601 

0.3793 

0*5887 

0.8326 

mmm 

1.5174 


为扩充这个表，请见式 （ 25) 和 （ 26) 以及习题 20 的答案 
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3.3 统计检验 


就其本身而言，式 （11) 不易于用计算机计算，因为我们要求无限多个： r 值的极 
大值。然而 FU ) 是递增的且只在有限步中增长，由此可以导出求统计量 

和值的简单步骤： 

步骤 1 . 获取独立的观察量 …，尤。 

步骤 2 . 重新排列这些观察量，使它们排成递增的次序，即使得 
(有效的排序算法是第5章的课题，但如同习题23中所示，在这种情况下有可能 

避免排序）。 

步骤 3. 通过下列公式得出所求的统计量： 


K 


n 



n max 

ri \ 


- F(X ; ) 



K 


n 




max [ F (X；) 


- 1 


n 



观察次数 72 的适当选择，对于这个检验来说，比 f 检验稍容易些，尽管某些考 
虑是类似的。如果诸随机变量&实际上属于概率分布 GU )， 而却被假定属于由 

FU ) 所给出的分布，则为否定 G ( x ) = F (: T ) 的假设将须取相当大的” 值； 因为我 
们需要72充分大，以期望经验分布和 F „ u ) 观察起来不同。另一方面， n 的 

充分大值趋向于把局部非随机的特性修平，而这样不合要求的特性在随机数的大多 
数计算机应用中具有相当大的危险；这又要求我们取 较小的 〃值。 一 个好的折中是 
取 72 等于（比方说）1000,并且在一个随机序列的不同部分上，来进行对于的大 

量计算，由此得到值 

K^oood), Kf_(2) ， … ， K 1 + 000 (O (14) 

我们也可以 再次对这些结 果应用 ks 检验： 这里设 fu ) 是 i < r CGG 的分布函数，并确 
定根据式 （ 14) 中观察的值得到的经验分布 F r ( x ) 0 很幸运，这种情况下的 FU) 是 
很简 单的； 对于像 n = 1000 这样充分大的 ri 值， K ；： 的分布由 

Foo ( x) = 1 - e~ 2x , x ^0 (15) 


充分逼近。同样的论述也可以应用于 K ；； ，因为和有着相同的期望特性。 

对于适当大小的 n 做若干次检验，然后在另 一 个 KS 检验 中组合这些观察量，这种 

方法将趋向于检测局部和全局两者的非随机特性。 

例如，当编写这一章时，作者做了以下简单的 试验： 把下一小节中所述的 “5的 
极大值”检验用于一组1000个一致的随机数上，得到200个观察量 X l5 X 2 , 

X 20() ， 假设对于它们属于分布 F ( x ) = jc 5 0 把这些观察量分成20组，每组 

10个，计算每组的统计量 KA 。 如此得到20个的值，导致了图4所示的经验分 

布。图4的每一个图形中所示的光滑曲线，是应有的真正的分布。图 4( a ) 示出 

了由序列 
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Y n + 1 = (3141592653 Y , + 2718281829) mod 2 35 ， U n = Yj 2 35 

得出的的经验分布，而且它是令人满意地随机的。图 4( b ) 是由斐波那契方法得 

到的，这个序列有全局非随机的特性，即，可以证明，在“5的极大值”检验中，诸观察 
量；^ 不具有正确的分布 F (_ x ) = ： r 5 。 图 4( c ) 来自口碑不好且无效的线性同余序列 

y „ + 1 = ((2 18 + l)Y„ + l) mod 2 35 , U n = YJ 2 35 0 

应用 KS 检验于图4中的数据，就得出了 （12) 中所示的结果。就72 =20参照表 
2,我们看到对于图 4( b ), K 2 + Q 和 Km 的值是几乎可疑的（它们处于大约5%和88%的 

水平），但还没有坏到要立即拒绝它的程度。当然，图 4( c ) 的 Km 完全不协调，所以 

“5的极大值”的检验揭示了该随机数生成程序肯定通不过。 

我们预料，在这个实验中的 KS 检验在确定全局非随机性方面比确定局部非随 
机性要更困难，因为图4的基本观察所用的抽样中，每个抽样仅包括10个观察量。 
如果我们取20个组，每组1000个观察量，则图 4( b ) 将显示一个更加显著的偏离。 
为了说明这点，应用单个的 KS 检验于导致图4的所有200个观察量，得到下列结 

果： 

图 4( a ) 图 4( b ) 图 4( c ) 

K 2 + oo 0.477 1.537 2.819 (16) 

K200 0.817 0.194 0.058 

这里已经确定地检测出斐波那契生成程序的全局非随机性。 

我们可以总结 KS 检验如下 ：给出 n 个独立的观察量 & ，…， ，它们取自某个 

由一个连续函数 FU ) 所确定的分布，即， FU ) 必须像图 3( b ) 和 （ c ) 所示的函数那 
样，没有图 3( a ) 中那样的跳跃。把紧挨在等式 （13) 之前说明的步骤用于这些观察量 
上，就得到统计量和这些统计量应当按照表2来分布。 

现在可对 KS 检验与％ 2 检验作某些比较。首先，我们应注意到， KS 检验可以 
与 x 2 检验一起使用，以给岀一个比我们在总结 x 2 检验时提到的特殊方法更好的过 
程 （ S 卩，比起进行三次检验并考虑这些结果有多少是“可疑的”来，有一个更好的方法 
可以使用）。假设我们对于一个随机数序列的不同部分，已经做了比如说10次独立 
的％ 2 检验，并得到值 V 10 o 简单地计算有多少个 V 是可疑地大或小并 

不是一个好策略。这个方法在一些极端情形下是有效的，而非常大和非常小的值可 
能意味着序列有过多的局部非随机性；但更好且更一般的方法是画出这10个值的 
经验分布函数，并把它同正确分布（可以从表1得到）进行比较。这将给出 Z 2 检验 
结果的更清晰的写照，而且事实上统计量和 Kro 可作为成功或失败的标志来确 

定。如果仅有10个值或甚至多到100个值，这些都能通过手算和利用图形的方法 
容易地 完成; 对于更大量的 V ，就需要有计算 x 2 分布的计算机子程序了。注意，图 
4( c ) 中所有20个观察量落乂 5%和95%7大平之间，所以我们在个体上并未认为它们 

中任何一个是可疑的；但在总体上看，经验分布却表明这些观察量是不正常的。 

KS 检验和；^检验之间的一个重要差别在于， KS 检验应用于没有跳跃的分布 
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F (: c ) ，而％ 2 检验应用于只是跳跃的分布（因为所有观察都分成々个范畴）。因此这 
两个检验是为不同种类的应用而设置的。然而甚至当 F ( jc ) 连续时，如果把 F ( x ) 
的区域分成々部分，并忽略在每个部分内的变化，则也有可能应用；检验。例如， 
如果我们要来检验 UbU 2 ，…， U „ 是否可认为是0与1之间的一致分布，则可以检 

验它们对于是否有 F(x) = x 分布。这是 KS 检验的一个很自然的应用。 
但是我们也可以把从0到1的区间分成100个相等部分，计算有多少个 L 7 落到每 
个部分，并且以自由度99来应用检验。对于比较 KS 检 验和； 检验的有效性, 
目前，还没有许多可资利用的理论结果。作者找到了某些例子，其中 KS 检验比 x 2 
检验更明确地指出非随机性，而在其它例子中，则是/检验给岀了更有意义的结 
果。例如，如果把上边提到的100个范畴编号为0，1，…，99,而且如果同期望值的偏 
差在0到49的间隔是正的，而在50到99的间隔是负的，则经验分布函数将更多地 
由 FU ) 的而不是由％ 2 的值所 指出； 但如果在间隔0,2,…，98中岀现正的偏离，而 
在间隔1，3,…，99中出现负的偏离，则经验分布函数将趋向于更紧密地靠拢 FU )。 
因此，测定的偏差种类稍有不同。应用检验形成图4的200个观察量，其中々= 
10,所得的 V 的值分别是 9.4,17.7 和 39.3; 所以在这个具体的情况下这些值同在 
(16) 中给出的 KS 的值是十分相近的。由于；检验本来就不太精确，而且又要求有充 
分大的”值，因此当有待检验的是一个连续分布时， KS 检验就具有若干优点了。 

还有一个有趣的例子。导致图2的数据是对于以 “ r 的极大值”为原 
则，以 ”=200个观察量为基础的；统计，且这个范围分成10个同等可能的部分。 
KS 统计量 K 2 + QQ 和 K 20 Q 可由完全相同的200个观察量的诸组来计算，而且这些结果 

可以以和我们在图2中所采用的完全相同的方式造表（指出哪些 KS 值超过99%的 
水平，等等）。图5中 7 K 出了在这种情况下的结果。注意，生成程序 D ( Lehmer 原来 
的方法）在图5中显得非常坏，而对 于相同的数据 ， x 2 检验在图2上则显得非常顺 
利；相反，生成程序 E (斐波那契方法）在图5中看起来还不那么坏。好的生成程序 A 
和 B ， 令人满意地通过所有检验。图2和图5之间出现矛盾的原因，主要是 ：（ a ) 观察 
量个数200,对于一个功能很强的检验来说实际上不 够大； （ b )“ 拒绝”、“可疑”、“几 
乎可疑”的排列规则本身就是可疑的。 

(附带说一下，由于在20世纪40年代使用一个“坏的”随机数生成程序而责备 
Lehmer 是不公正的，因为他对生成程序 D 的实际使用十分有效。 ENIAC 计算机是 
一台高度并行的机器，它借助于一个线路连接板进行程序 设计； Lehmer 把它设置成 
使它的累加器之一重复地以23乘它自己的内容（模10 8 十1)，在几毫秒内就得到一 
个新值。由于乘数23太小了，我们知道，通过这个过程得到的每个值和它前边得到 
的值就太密切相关了，因而难以认为它是充分随 机的； 但是由伴随的程序所使用的 
特殊累加器，其中实际使用的值之间的持续时间是相对较长的，而且有某些变动。 
所以对于很大的而且变化的々值有效的乘数是23\) 

C •历史、文献和理论 1900年 ， Karl Pearson 引进了 乂 2 检验 [Philosophical 

Magazine , Series 5 ， 50 ， 157〜 175] 。 Pearson 的重要论文被认为是现代统计学的基础 
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K 才的范围 
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图 5 KS 检验应用于和图 2 相同的数据 

之一，因为在这以前，人们只是简单地用图形来画出实验的结果，并断定它们是正确 
的。在这篇论文中， Pearson 举出了以前滥用统计学的若干有趣的例子；他还证明了 
轮盘赌中的某些机遇 （1892 年他在蒙特卡罗实验了两周时间），同期望的频率相差 
竟如此之远，以致对于一个公正的轮子也只能以大约10 29 对1的赌注打赌！ William 
G . Cochran 的评述论文中有关于 f 检验的一般讨论和广泛的文献。 ^Annals of 
Math . Stat . 23 (1952)，315 〜345。 

现在我们给出关于 X 2 检验的简单理论推导。容易看岀 ， Yi = 3 M ，…， h = %的 


精确概率是 


n ! 


卜"义！ 


P \ ” " Pi k 


(17) 


如果我们假定 ， Y 5 以泊松 （ Poisson ) 概率 


np 


S 


( np s ) 


s 


y s ! 


有值％，而且这些 Y 是独立的，则 （Y 


np 



， h ) 等于（: yi ，… ， m ) 的概率是 

np s ) 


乂！ 


而且 A +…+ K 等于 n 的概率是 


2 






s 


np ,) 


s 



jy + ■■■ 十 二 M 


义 ！ 


n ! 


1, … " 0 

如果我们假定，除了条件 Yi 十 


+ 


Y k 


n 夕卜，它们是独立的，则 （Y 


， K ) 


♦ 
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( ji ，… ，: ^ ) 的概率是商 


k 






i 


(np s ) 


s 


y s i 


- n^n 

e n 


n ! 


这等于式 （17)。 因此，除了它们有固定的和这一事实之外，我们可以认为这些 K 是 
独立的泊松分布。 


做一下变量的改动是方便的，令 


Z 




np 


S 


y^Ps 


(18) 


使得 V 





籲蠡 # 


+ zi 


条件 h 十…+ Y 是 




n 等价于要求 



Z 



+ \ fpk^k 



(19) 


让我们考察使得式 （19) 成立的所有向量 （ Z : ， 


，厶）构成的 U - 1) 维空间 S 。 对于 


大的 n 值，每个 Z 5 有近乎正态的分布（参考习题 1.2.10-15); 因此，在 S 的一个微 


分体积 dA , 


畚參暑 


内的点 以近似 正比于 exp ( - (4 十…十；4)/2)的概率出现（在推 


导中，正是这一点使？方法对于大的〃仅仅成为一个近似方法) 
概率为 


于是的 


2 


2： ■ 〉在 , + …+ z , < 


exp ( - ( z \ + + z \ ) i 2) dz 2 






ex 


« •. 〜 


)在3中 


p (~ (^1 + 




+ z \ )/2) dz 2 m ' , dz k 


( 20 ) 


由于超平面 （19) 通过 A 维空间的原点，故 （20) 中的分子是对一个中心在原点的 
U -1) 维超球面内部的一个积分。对于某个函数/，以径；^和角度_，…，％_ 2 做 

适当的广义极坐标变换，把式 (20) 变成为 


乂 I 2 '少 - 1 




X 


/(0>1 ， … ，叫一 2 )d%dw‘dco 


k -2 


e 


X /2 


X 


一 2 


/( ，…，⑺々— 2 )d 尤 dojfdc^- 


(见习题 15); 然后对角度叫，…，叫 


-2 


的积分给出一个常数因子，从分子和分母中消 


去之。最后我们得到的近似概率的公式 

V /2 ^-2 , 

e % x 

^ 0 __ 

^ oo 2 

. ^ Xl 2 x k ~ 2 ^x 


( 21 ) 


上述的推导使用了符号％来表示径长度，恰如 Pearson 在他的开创性论文中所 


做的 那样； 这就是/检验得名的由来。代入 


?/2,这一积分可以借助于不完备 


的伽玛函数来表示，这就是我们在 1.2.11.3 节中讨论的 


lim Pr ( V ^ v 


7 



oo 


—1 _v 


V 


k - 1 



( 22 ) 
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这正是具有 k - \ 自由度的％ 2 分布的定义。 

再来看 KS 检验。1933年 A . N . Kolmogorov 提出了一个以统计 

K n = \Tn max | ( x ) - F ( x ) | = max ( K :，_ K :) (23) 

-°° < x< +°° 

为基础的检验。 N . V . Smimov 于 1939 年对这个检验做了若干修正，包括我们在上 
边已经提到的个别地考察和在内。类似的检验有很多，但和似乎 

最便于计算机应用 。 J .Durbin 在 Regional Conf . Series on Applied Math . 9 ( SIAM ， 

1973) 的专题文章中，详尽地评述了有关 KS 检验及它们的推广的文献，其中包括一 
份广泛的文献目录。 

为了研究 K ；： 和的分布，我们从下面的基本事实出发 :如果 X 是具有连续 

分布的 FU ) 的一个随机变量，则 F ( X ) 是一致分布于0与1之间的实数 。为证明这 
一点，仅仅需要验证，如果则 F ( X )^ y 的概率为 3 ；。由于 F 是连续的，故 
对于某个〜有 FU Q ) = 3N 于是 FiXX . y 的概率是的概率。由定义，后者 
的概率为 FUo )， 即它为 

对于令 Y ^ nFU ,)， 其中诸 X 如同在上边的步骤 2 中那样是已排 
好序的。于是诸变量&和独立的、已经排序成为非递减次序的 0 和〃之间的一致 
分布随机数一样 ， A ;而且式 （13) 的头一个等式现在可以变换成为 


K 



max ( 1 - Y ly 2 - Y 2 r '' ,n - Y n ) 



如果0<〖<72,则的概率是对于，的概率。借助于 n 
维积分这不难表示 


n 




a 


y 


n 


d ： y， ? 


—1 
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y 
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d^i 


n 


n-\ 
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n 


0 






n 


0 


d^rz-1 


: y 


，其中 


a 


2 


max ( j 


，，0) 




(24) 


这里分母可以立即 算出： 它等于 n ”/ n !， 这是有意义的，因为具有 0 <为< 72的所有 
向量 （ M ，％, …，: Vn ) 的超立方体的体积是 〆 ，而且它可以划分成对应于诸: V 每个可 

能的排序的〃！个相等部分。分子中的积分稍难些，但可按习题17中提示的方法求 
解，使我们得到一般的公式 


Pr ( x ；<^)=42 [ n \ k - t) k (t + n ~ kY -^ = (25) 

\ / n Q« t \k 1 


1 _ ~ (k - t) k (t + n - (26) 

71 t<k^n^ ^ ' 

K ~ 的分布与此完全一样。式 （26) 首先由 N . V . Smirnov 得出 [ L / speiciii ‘ Mat . TVauic 
10( 1944 )，176〜206 ]; 也可参考 Z . W.Birnbaum 和 Fred H . Tingey , Annais Math . 
Stat . 22 (1951),592 〜596。 Smirnov 对于所有固定的，推导出下列近似 公式： 

Pr ( K : ^ s) = 1 — e~ 2s ^1 — ~5/ \!~n + 0(1/ n ) (27) 
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这产生出在表2中出现的对于很大的 rz 的近似值。 

阿贝尔的二项式定理，即式 1.2.6-(16) 证明了 （25) 和 （26) 的等价性。使用这两 

个公式的任何一个我们可以扩充表2,但有一个有趣的 折中： 当给定 s = 时，尽 

管 （25) 中的和只有大约项，但必须以多精度算术来计算之，因为这些项很大，而 
且它们的前导数字都消失掉了。在 （26) 中却没有这样的问题，因为它的项都是正 

的，但 (26) 有 n - s 4 n^io 

习题 

1. [00]应当使用/表的哪一行来检验式 （5) 的值 V = 7 &是否 是过于高了？ 

2. [20] 如果两个骰子被“装铅”，使得一个骰子上值为1的那一面朝上的次数恰是其它任何 
一面朝上次数的两倍，而另一个骰子则类似地偏倚于6,试计算概率久，即对于 2< s <12, 两个骰 

子的和数为 s 的概率。 

► 3.[23]两个如上题所述那样装了铅的骰子被投掷144次，并且观察到下列的一 些值： 

5值=23 4 5 6 7 8 9 10 11 12 
观察数，2 6 10 16 18 32 20 13 16 9 2 

利用式 （1) 中的概率对这些值进行/检验，并假装不知道这个骰子事实上是有毛病的。试问它 
能否发现这个骰子是坏的？如果不能，说明原因。 

► 4.[23] 通过模拟这样一对骰子，其中一个是正常的，而另一个被装铅，使得它经常使1或6 
朝上（后两者的概率是同等的），作者实际得到了 （9) 中实验1的数据。试计算在这种情况下的概 
率以代替（1)，并利用^： 2 检验判断这个实验的结果与如此装铅的骰子是否一致？ 

5. [22] 设 FU ) 为一致分布，如图 3( b ) 所示。请对下列20个观察值求尺克和 

0.414,0.732,0.236,0.162,0.259,0.442,0.189,0.693,0.098,0.302, 

0.442,0.434,0.141,0.017,0,318,0.869,0.772,0.678,0.354,0.718 

并指出这些观察量相对于这两个检验的每一个是否同预期的特性有重大差异。 

6 . [ M 20 ] 对于固定的 1 ，考虑式 （10) 中给出的 F w ( x ) 0 给定一整数 s ， 问 F n ( j ：) = sin 的概 

率是多少？ F / a ：) 的平均值是多少？标准差是多少？ 

证明和 K ；： 绝不能为负， K ；： 最大可能的值是多少？ 

8. [00] 正文中描述了一个实验，实验中在研究一个随机序列时得到了统计量的20个 

值。画出这些值，得到图4,并从得到的图形算出了统计量 KS 。 问为什么用《=20的表项来研究 
得到的统计，而不用〃 =10的表项？ 

► 9.[20] 正文中叙述的实验由画出的20个值组成。它们是把5的极大值检验应用于一 
个随机序列的不同部分而算出的。也可以计算的相应的20 个值； 因为 Kb 与有相同的分 
布，所以可以把这样得到的40个值 （ S 卩的20个值和的20个值）总括起来，并可应用 KS 
检验得到 K 4 + Q 、 K 4 o 的新值。试讨论这一设想的优点。 

► 10. [20] 假设通 过做〃 次观察来完成一个^： 2 检验，并得到值 V 。若再用同样的 n 次观察重 
复这个检验（当然，得到相同的结果），并且把两次检验的数据放在一起，把它当做对次观察的 
一次单独的/检验（这个过程违背了正文中指出的所有观察必须彼此独立的约定）。试问第二个 
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V 值如何相关于头一个值？ 

11. [ iO ] 以 KS 检验代替 x 2 检验，解习题10。 

12 . [ M 28 ] 假设对 n 个观察量的一个集合进行;检验，同时假定 久是 每个观察量落人范畴 
s 的 概率； 但又假设事实上这些观察量落人范畴5的概率为 t (参看习题3)。当然，我们 
希望 X 2 检验能检测出关于 A 的假定是不正确的这一事实。试证，当 rz 充分大时能做到这一点。 

并证明对于 KS 检验也有类似的结果。 

13. [ M 24] 证明式 （13) 等价于式（11)。 

► 14.[ HM 26] 设乙由式 （18) 给出。如果当72—⑺时…，厶有界，试利用斯特林近似 
公式直接证明多项式概率 


” ！ /… 必 /6 卜 -1! = e- VI2 I ^ (2nn) k - l p^-p k + 0(n~ kl2 ) 

(这个思想导致了 /检验的一个更接近于“基本原则”的证明，而且比正文中的推导省事。） 

15.[HM24] 二维极坐标习惯上都由等式 x — r cos (9 和沒定义。为了积分的目的， 
我们取 dxdy = rdrdd 0 更一般地说，在 r ? 维空间中，我们可以命 

x k — r sin *--sin 6 k ^ y cos 6 k , \ ^ k <i n 


试证在这种情况下 



dx l dx 2 B ^dx 7} = r n ^ 1 sin 71-2 ^] -^sin (9 n _ 2 dr 

► 16.[ HM 35] 推广定理 1.2.11.3 A 以求出对于大 i 和固 定的: y ， z ， 


y(x + 1，工 + z v 2 x + y ) lT(x + 1) 


的值。忽略答案中的 0( l / x ) 项，用这个结果来找出对于大 v 和固定的多，方程 



的渐近解 r ， 由此解释表1中指出的渐近公式。[提 示： 见习题1.2,11.3-8。] 

17 .[ MH 26 ] 设〖是一个固定的实数，对于设 


p n k ( 工 、= 

^ X 

dx” 

^ X 

n 

"^十 2 j 

d 工々 +1 

k + \ . 

d 工々 … 


n — 1 ^ 

T 7 — 1 — ^ ^ 

k + 1 — i ^ 

o J 


dx 



约定 PooU ) = l 。 证明下列关系: 



X + 


dx 


n 
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n — 1 
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走 + 2 


d:r 
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々 +1 
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djTj 


b ) P„q(x) = (x + t) n jn \ - {x + t) n ~ l i ( n - 1)!。 


c ) P nk (x) ~ P n{k _ x) (x) = 、 k k ': 、 P(^ k )o(^ — O , 其中 

d) 求得的一个一般公式，并应用它计算式 （ 24 )。 

18. [M20] 说明为什么与 K„ + 有同样的概率分布的“简单”原因。 

19. LHM48] 提出类似于 KS 检验的检验，以便用于多元分布 F(x l ^- f x r ) = Pv(X l <x ly -, 
X r < x r ) 0 (例如，这样的过程可用来代替下节中的“序列检验 ”。） 

20. [HM41] 导出 KS 分布的渐近特性的高次项并推广 （ 27 )。 

21. [M40] 尽管正文指出， KS 检验仅可应用于 FU ) 是连续的分布函数的情况，但是甚至当 
分布有跳跃时，仍有可能试图计算 iC 和试分析对于各种不连续的分布 F(x) t K ： 和 

的概率特性。对于若干随机数的抽样，试把所得到的统计检验的有效性与；^检验作比较。 

22. [HM46] 试研究在习题 6 的答案中建议的“改进了的” KS 检验。 
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23.[ M 22]( T . Gonzalez ， S.Sahni 及 W . R . Frama ) ( a ) 假设 KS 统计量 K : 的公式 （13) 中的极 

大值在一个给定的下标 j 处出现，其中 L#UO)」 =々。证明 F ( X J ) = max«„ |F(X) | 

（ b ) 设计在 0( n ) 步内计算和的一个算法（不用排序）。 

► 24.[40] 对不同的《计箅/统计量 V 的精确分布，实验在三个范畴上的各种概率分布（/>， 
7')，其中 p + g + r = 由此确定具有两个自由度的一个近似/分布的精确程度。 

25 .[ HM 26 ] 假设对于¥, = 2：/ =1 七户： ; +内，其中是均值为0、方差为1 

的独立随机变量，而且矩阵 A = (~) 有阶72。 

a) 借助于矩阵 A 表达协方差矩阵(：=(~)，其中 ~ = E(y,- 内）（\-仏）。 

b) 证明： 如果乙=(~)是使得 CSC=C 的任何矩阵，则统计 

mm 

w - ",)(乃-内心 

f = 1 j = 1 

等于幻+…+ X 2 „。 [因此，如果 X 有正态分布，则 W 是有 n 个自由度的/分布。] 

The equanimity of your average tosser of coins 
depends upon a lawwhich ensures that 
he will not upset himself by losing too much 
nor upset his opponent by winning too often . 

你对于普通的硬币投掷持顺其自然的态度 

同一个定律有关……这个定律确保 
你将不会由于输得太多而心烦意乱， 
也不会由于赢得太频繁而使你的对手烦恼不宁。 

— TOM STOPPARD ， Rosencroniz 8 >l Guildenstern ore Deod ( 1966) 

3.3.2 经验检验 

本节我们讨论 11 种已被用于观察序列的随机性的特殊检验。对于每一检验的 
讨论都有两个部分 ： U ) 对实施该检验的“插入式”描述； （ b ) 关于这个检验的理论基 
础的研究。（缺乏数学训练的读者，可以跳过理论的讨论。反之，对于有数学基础的 
读者，即使他们从来未曾打算检验随机数生成程序，仍可以发现有关的理论是十分 
有趣的，因为其中包含了某些有益的组合问题。事实上本节涉及的某些话题在稍后 
的不同内容中也是很重要的。） 

每一个检验都旨在应用于0和1之间独立和一致分布的一个实数序列 

(u n ) 二 U 0i U u U 2 r- ( 1 ) 

某些检验并不是为实数序列 （1), 而主要是为取整数值的序列设计的。在这种情况 
下，检验中使用的辅助序列 

y, = Y 0 , L ， Y 2 ，… (2) 

由规则 

<y,> =L 机」 ⑶ 

定义。这是个整数序列，在0与 3-1 之间独立和一致地分布。数 d 是为了方便而 
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选 择的； 例如，在一台二进计算机上，可以有2 = 64 = 2 6 ，使得1^表示 I ；。 的二进表 

示的六位最高位。 d 的值应当充分大，以使这个检验富有意义，但也不能大到使检 
验变得难以进行而不实用。 

在这一节，量 L /„， 和 d 自始至终有上文的意义，但 d 的值在不同的检验中 
可以是不同的。 

A. 等分布检验（频率检验） 序列 （1) 必须满足的第一个要求是它的数实际上 
一致分布于0与1之间。有两种方式进行这种检验： （ a ) 对 F ( x ) = :?：， 0 <： 2 ：< 1 ，用 
KS 检验。 （ b ) 命 d 是一个方便的数，例如在一台十进制计算机上的100,在一台二 
进制计算机上的64或128,而且使用序列 （3) 来代替序列（1)。对于每个整数 r ,0< 
r < d 及0< ; <72,计算 Y ; = r 的次数，而后对于每个范畴利用 k 二 d 和概率九二 

1 M , 应用 f 检验。 

这个检验背后的理论已在 3.3.1 节叙述过了。 

B . 序列检验 更一般地，我们要求相继的数偶独立地一致分布。太阳升起的 
次数总是与它落下的次数一样多，但这并不使它的运动成为随机的。 

为进行序列检验，我们只需计算对于数偶：^ + 1 ) = “，0出现 

的 次数； 这些计数是对的每个整数偶 U ， r ) 进行的，而^检验被应用于 
这些个范畴上，其中每个范畴的概率是 II 和等分布检验一样可以是 
任何方便的数，但它将稍微小于上面提议的值，因为一个有效的/检验应当使 n 
相对于 A 说来足够大（比如说，至少 n >5 d 2 )。 

显然，我们可以把这个检验推广到三元组、四元组等等，以代替数偶（见习题 
2); 然而，必须急剧地减小^的值以避免范畴太多。因此，当考虑四元组和更大量的 
相邻元素时，我们利用像下边所述的扑克检验或极大值检验这类精确度较差的检 
验 。 

注意，在这个检验中，使用了序列 （2) 的 2 n 个数来进行;2次观察。对于数偶 
(,(1^,72) ，…， ， Y W ) 实行序列检验是错误的，读者能看出为什么吗? 

我们倒可以对数偶 （ Y 2; + 1 , Y 2;+2 ) 实行另一个序列检验，而且期望这个序列同时通 
过这两个检验，请记住这些检验并不是彼此独立的。代替地 ， George Marsaglia 已经 

证明如果使用数偶 （ Y 。，70,(7^ Y 2 )， …， （ Y ^， 八），并且如果对相同的 d 值来 
对 Y Q ， …，使用通常的 f 检验方法计算其对于序列检验的统计 V 2 和对于频 
率检验的统计，则当72很大时， V 2 - %应当有 x 2 分布和 d ( d - l ) 的自由度（参 
见习题24)。 

C. 间隔检验 间隔检验用来考察在某个范围内出现的“间隔”长度。如果 
a 和是满足的两个实数，我们要考虑连续的子序列 R，R + 1 ，…， 

的长度，其中位于《和/?之间，但其它的 L ； 则不然（这 r + l 个数的子序 
列表示长度为 r 的一个间隔）。 
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算法 G (间隔检验的数据）任意给定 a 和 p 的值，把下列算法（参见图 6) 应用 
于序列 （1) ，它计算长度为0，1， - 1的间隔个数，以及长度大于或等于〖的间隔 

的个数，直到 造出” 个间隔的表格来。 






G 3. a ^ Uj < ( 3 r t 




否 



是 


G 6 .找到71个间隔？> 



是 


t 


图6搜集间隔检验的数据（“集券检验”和“运行检验”的算法均类似） 

G 1 •[初始化] 置 j — - 1， s — 0,并且对于〖，置 COUNT [ r ]— 0。 

G 2 .[置 r 为 0] 置 r — 0。 

增 1，如果 且则转到 G 5。 

G 4 .[增 r ] r 增1，并返回 G 3。 

G 5 • [记录间隔长度](长度为^的间隔现已找到。）如果 r > Z ，则 COUNT [纟]增 

1，否贝 U COUNTS ] 增 1。 

G 6 .[找到 n 个间隔了？] 5增1。如果 sCrz ， 则返回步骤 G 2。 ■ 


实施了此算法之后，应用/检验于 COUNT [0]， COUNT [1]， …， C 0 UNT [〖]， 共々二 

r + 1 个值，并釆用下面的 概率： 

p r - p{l - p) r , 0 ^ r ^ ^ - 1 ; Pt = _ py (4) 

这里 p = 即的概率。通常， 72 和〖的值应选择成使 COUNT [ r ] 的每 

个值都预期为 5 或更大，愈大愈好。 

为了省去步骤 G 3 中的比较之一，常以 a =0 或0 = 1应用间隔检验。特殊情况 



0 


2 



2 


的检验，有时分别称做“中下运行”或“中上运行”。 


式 (4) 中的概率很容易导出，因此把推导留给读者。注意，如上所述的间隔检验 


考察了 n 个间隔的长度，它并不考察 




数之间的间隔长度。如果序列〈〉是充 


分非随机的，则算法 G 可能不终止。除此之外，还有考察一个固定数目的 U 的其它 
间隔检验（见习题 5)。 


D . 扑克检验（分划检验） “经典的”扑克检验考虑由五个相继整数组成的”个 
组 （ + + n ，并观察每一个五元组（无顺序）与下列七种形 

式中哪一种相匹配： 

全不同： abcde 满堂红： aaabb 

—^ 对： aabcd 四个同： aaaab 
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两对： aabbc 五个同： aaaaa 

二个同： aaabc 

X 2 检验是以在每个范畴中五元组的数目为基础的。 

为了便于程序设计，需要将这种检验改得简单一点，一个好的折中方案是仅仅 
计算五元组中不同值的个数。这样，我们有五个 范畴： 

五个值=全不同； 

四个值=一对； 

三个值=两对，或三个同； 

二个值=满堂红，或四 个同； 

一个值=五个同。 

这种分类更易于系统地确定，而且检验也几乎同样好。 

一般地说，我们可以考虑72个由々个相继的数组成的组，而且我们可以计算具 
有 r 个不同值的々元组的个数。然后利用有 r 个不同值的概率 


P 



d{d ~ \ - r + 1) k 

~ d k r 


(5) 


做 ？ 检验。（斯特林数 


^是在1.2_6节中定义的，利用那里给出的公式容易计算 


它们。）由于当 r = l 或2时，概率久非常小，所以在应用 f 检验之前，一般把低概 
率的一些范畴归并在一起。 

为了推 导出九 的适当公式，必须计算在0与 d -1 之间的/个々元组当中，有 
多少个恰有 r 个不同的元素，并以^来除这个总数。由于 + 

是从3个对象的一个集合中选出 r 个有序事物的数目，故我们仅须证明是把々 

个元素的一个集合恰巧分成 r 个部分的方法的数目。因此，习题 1.2.6-64 就完成了 
式 （5) 的推导。 


E. 集券检验 这一个检验与扑克检验有关，就像间隔检验与频率检验有关那 
样。使用序列…，并观察为得到由0到 d -1 的整数的“完备的集合”所要 

求的区段 （ + ^¥> + 2 ，…， K + r 的长度。算法 C 精确地描述了这个 方法： 

算法 C (集券检验的数据） 给定满足的整数序列 Y 。 ，…，本算 

法计算 n 个相继的“集券”区段的长度。待这个算法结束时， COUNT [ r ] 包含有长度 r 
的区段个数，其中 d < r < 〖，而 COUNT [〖] 含有长度>〖的区段个数。 

C 1 •[初始化]置 卜- 1，5—0,且对于〖，置 C 0 UNT [ r ]— 0。 

C2 .[置 g，r 为 0] 置 q ^- r^O ，且对于 < d ， 置 OCCURS [ 々 ]— 0 。 

C3 •[下一次观察] r 和 ； 增1，如果 0 CCURS [ ] 关0 ,则重复这一步骤。 

C4. [完备的集合？]置 OCCURS [ Yj — Ug — g 十1 ( 所观察的这个子序列至此 

包含个不同 的值； 如果= 1则得到一个完备的集合）。如果 （?< d , 则 
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返回步骤 C 3。 

C 5 •[记录长度]如果《，则 COUNT [ r ] 增1，否则 COUNT [ r ] 增1 
C 6 .[找到了 72个？] S 增加1，如果5<72,则返回步骤 C 2。 ■ 


该算法的一个例子见习题7。可以想像 ，一 个小孩要搜集^种类型的赠券，这 
些赠券随机地分布在他的早餐麦片盒中。他必须不断地吃麦片，直到找齐所有类型 

的赠券为止。 

在算法 C 计算了？2个长度之后，即可应用 f 检验于 COUNT [ d ]， COUNT[d + l ]， 
…， COUNT [纟]，其中6 d + 1。相应的概率是 


Pr 



d ^ r <i t y 


Pt 


1 - 


d ! 


d l 


-l 



( 6 ) 


为推导这些概率，我们略作说明：如果 l 是表示长度为 r 的一个子序列是不完备的 


概率，则由式 （5) 得 


Qr 


1 - 


d ! 


r 


d r d 


因为不完备意味着有一个 


元组，其元素没有全都不同的 j 个值。于是由关系九 


=% i 和对于 d<r 〈 t ， p r 二 q r — \_ q r 得到式 （ 6 ) 。 

与集券检验的推广有关，可得到一些公式，请见习题 9 和 10, 以及 George Polya , 

Zeitschrift fiir angev^andte Math , und Mech 10 ( 1930 )，96 〜 97; Hermann von 

Schelling ， AW 61 (1954)，306 〜311。 


F . 排列检验把输人序列分为 72 组，每组 z 个元素，即 （ ％，％ +1，…， 

+ ，其中 OgjCrz 。 在每组中的元素可以有 H 种可能的相对顺序；计算每种 

排序出现的次数，以 k = t \ 并以每种排序的概率 1/ H ， 应用％ 2 检验。 

例如，如果 r = 3,根据 U 3j < U 3j + l < + 2 或 U 3j < U 2j+2 < 1 或…或 

我们将有六个范畴。在这种检验中，假定诸^■不相等。由于 

两个 U 相等的概率是0,这样的假定是正当的。 

在 一 台计算机上实施此检验的一种方便的方式是使用以下的算法，它本身就很 

令人感兴趣。 


算法 P (分 析一个排列） 给定不同元素 （ ，…， R ) 的一个序列，计算一个整 
数 /( R ， …， K ) 使得 

< t \ 

而且 /( LA ，…， K ) = /( %当且仅当 （ LA ， …， R ) 和 （ ％，…，有相同 
的相对排序。 

P 1 •[初始化]置 r^~t , /<-0 0 (在算法执行期间，我们有0</< t \ lr \ 0 ) 

P 2 .[找极大值]找 I LA ， …，的极大值，并假设 G 是极大值。置 /— 广 / h - 1。 

P 3 •[交换]交换 U r HU s 。 

P 4 .[减少 r ] r 减1。如果 r >1，则返回步骤 P 2。 I 


当这个算法停止时，序列 （ ，…， 17,) 将已经排为递增次序的。为证明结果/ 
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tl 一 地表征 （ L/j ，…， R ) 的初始次序，注意算法 P 可以向后 运行： 

对于厂= 2，3，•••，，， 

置 s 一 f mod r y f flr ]， 

并交换 U^U ⑴。 

容易看出，这将消除步骤 P 2 〜 P 4 的 影响； 因此没有两个排列可以产生相同的/值， 
因而算法 P 的效果与前面所说的一致。 

奠定算法 P 的基本思想是称做“阶乘数系统”的混合进制表示。在0</< H 范 
围中的每个整数可惟一地写成形式 

/ = ( ••• ( ^_! X ( ^ - 1) + C t - 2 ) x (t - 2) + + c 2 ) X 2十 q = 

( 广 一 lMq—i + G - 2)! (: 卜 2 + … + 2!(：2 + 1 !c 1 (7) 

其中“数字”~是对于 l < j < t 满足 

0 < < j ( 8 ) 

的整数。在算法 P 中，当对于给定的 r 值执行步骤 P 2 时， g_i = s -1。 


G . 运行检验 一个序列也可以做“上行运行”和“下行运行”检验。这意味着， 
我们考察原来序列的单调子序列的长度，即递增或递减的区段的长度。 

作为运行的精确定义的一个例子，我们来考虑十个数的序列“1298536704”。在 
左端和右端，以及每当4>& + 1 时在&和 \ + 1 之间置一竖线，我们得到 

II 2 9181513 6 710 41 (9) 

它显示了“上行运 行”： 有一个长度为3的运行，后边跟着长度为1的两个运行，后边 
又接着长度为3的另一个运行，再接着长度为2的一个运行，习题12的算法说明怎 
样来造“上行运行”长度的表。 

不像间隔检验和集券检验那样（在许多方面它们类似于这个检验），我们将不应 
用 /裣验于运行计算，因为相邻的运行不是独立的。一个长的运行势必跟随一个 
短的运行，而且反过来也是一样。这种独立性的缺乏，足以使一个直截了当的 x 2 检 
验失效。替代的是当运行长度已经如习题12那样确定时，可以计算下面的统 计量： 


V 



- 6 


2 (COUNT[ 2 ] 


n^)(C0UNT[j] - nb } ) 





其中 n 是这个序列的长度，系数矩阵 A 







(b：) 




由 


' 4529.4 9044.9 13568 18091 22615 27892、 

9044.9 18097 27139 36187 45234 55789 

13568 27139 40721 54281 67852 83685 

~ 18091 36187 54281 72414 90470 111580 

22615 45234 67852 90470 113262 139476 

.27892 55789 83685 111580 139476 172860. 




24 

11 

120 

19 

720 

29 

5040 



58 


840 


给出 


o 


(这里所示的^的值仅仅是近 似的； 利用以下推导的公式，可以求得其精确 


值。）当〃很大时，式 ao ) 中的统计量 V 应具有自由度 6( 不是 5) 的 X 2 分布 。比如 
说，〃的值应当是4000或更大。同样的检验可应用于“下行运行”。 

习题14中有一个更简单和更实用的运行检验，所以，只对检验随机数生成程序 
感兴趣的读者可跳过以下数页，并在考虑习题14之后就转到、的极大值检验”去。 
另一方面，对于相互关联的运行，从数学的观点探讨如何建立一个复杂的运行检验 
是有启发性的，所以我们现在将偏离主题片刻。 

给定77个元素的任何排列，如果位置 z 是长度 p 或更大的一个递增运行的开 


头，命 Z Af 


1，否则命 


0 


例如，考虑72 


10的排列（9)，有 


Z n = Zi \ — = Zi ^ = Zic = z 


21 


31 


14 


15 


16 


Z26 = Z 


36 


2^19 = = 


29 


而所有其它的 Z 皆为 0 


在此记号下 


是长度的运行的个数，而且 


z P 



^ pl 十 ••• 十之 




( 12 ) 


R P = K - K + i (13) 

是长度恰为 P 的运行的个数。我们的目标是要计算 只， 的平均值，还要计算 协方差 


P + 1 


covar ( R h ，R 


mean ( (R 


mean(D)(i? 


Q 


mean ( jRg ))) ① 


它测量和\的相关性。这些平均值应计算作所有个排列的集合上的平均 

值。 

式 （12) 和 （13) 说明，问题的答案可借助于2#和的平均值来表达，于是作 
为推导的头一步，我们得到下列的结果(假定 i < i )： 


71 


IX 


P 


(p 

0, 




1 )! ， 


如果 i < ?2 


P 



否则 


n ! 


2 二 


(p + ^ii)q 


(p ^ l)\(q + 


(14) 


P 





1 )! ， 


P 


如果 



p K j ^ n 


Q 




Q 



8： 


(P + l)\q 

0 ， 


(夕 + g + 1)! ’ 


如果 



P 


i ^ n 


q + 1 


否则 


符号 2 表示对所有可能的排列求和。为了解释这里所涉及的计算，我们来处理最困 


难的情况，即当 f 



P 


+ 且 i>l B 寸。量或者是0或者为1，所以 


求和应由计算所有使= 1的排列 Alh … U n 的计数所组成，即使得 


U 


> 




< U 


1 > U 


+P 


< 




< U 


i + p + q — \ 


(15) 


的所有排列。这样排列的个数可枚举如 下：有 


71 


P 



Q 


+ 


种方式来选择具有式 （15) 


① covar 表示协方差， mean 表示平均值。-译者注 
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中所示状况的元素。有 


(P + Q 



1) 


P 



q 


P 



Q 



P 



Q 




P 


P 


(16) 



种方式把它们安排成次序 （15) ，如同习题13中 所示； 而且有 （n - p - q - l )\ 种方式 


来排列余下的元素。于是，总共有 


n 


P 



q 



n - p - q - I ) \ 乘 （16) 种方式，将其 


除以 n !， 即得到所求的公式。 


从关系 （14) ，一 个稍长的计箅给岀 


meaniR'f 


n 



(p 



Hi 


- l ) 


P ! 


A ^ P n 


(17) 


covar( l, R c 


mean ( R ' pRq ) 


mean( )mean( ) 


2 




17 2 ^ pi^qj - mean( jR ^) mean( R ^ 


mean(R:) + f(p 


若夕 + <7 < 


n 


其中 


max( p ， q) ， s 


mean(^R:) — mean( )mean ( 尺；）， 

= 户 + 9 ，而且 


若 p + <? > 


(18) 


n 


f(p 






… x/ {(p 

(s 2 -5-2) 


2 s 

(s + 1)1 



2(^) + 
\ 5 ! / 




(p + 1) ! ( <? 



D ! 


(19) 


可惜的是，协方差这 


表达式过于复杂，但它对于如上所述运行检验的成功是必要 


的 


0 


从这些公式容易计算 


covar 


mean( R 

(Rp.K) 


mean( jRl) - mean(i?: 


p + 


covar(R; ， i^) - covar( , jR^) 


( 20 ) 


covar (R h , R n ) 


covar 


r(R 


Rq) - covar,-Rg + l 


在 Armais Math . Stat . 15 (1944) ， 163 




165 中， J . Wolfowitz 证明了假定平均值和协 


方差表达如上，则当 n 


⑺时，量 Ry , R 2 ^ 


#噘 ■ 


变成正态分布的。这意味着 


如下的运行检验是有效的：给定〃个随机数的一个序列，计算对于长度为 


P 的运行2^的个数，以及长度为 


或更大的运行 iT , 的个数。令 


Q 


R I - mean( R \) , 

Ql = 


i i 1 


， Q /- 


jR^_! - mean( R t 


— l 


R ： 


mean ( ) 


( 21 ) 


构造诸 f 的协方差的矩阵 C ; 例如，(: 


13 


d 只 3 )，而 c 


n 


covar (R 


iOo 当 


6 时，如果 n >12, 我们有 


C = nCi + C2 


(22) 


其中 


23 

180 


C 


360 

- 5 
336 

一 433 
60480 

- 13 
5670 

- 121 
181440 


- 7 


— 433 

- 13 

-121 

360 

2843 

336 

— 989 

60480 

- 7159 

5670 

-10019 

181440 

—1303 

20160 

一 989 
20160 

一 7159 

20160 

54563 

907200 

- 21311 

362880 

- 21311 
1814400 

836657 

1814400 

- 62369 
19958400 

- 257699 

907200 

- 7783 
9979200 

- 62611 

362880 

1814400 

39916800 

239500800 

239500800 

—10019 

- 62369 

- 257699 

29374811 

- 1407179 

1814400 

19958400 

239500800 

5443643200 

21794572800 

- 1303 

- 7783 

- 62611 

- 1407179 

2134697 

907200 

9979200 

239500800 

21794572800 

1816214400 


C 2 


83 

- 29 

- 11 

一 41 

91 

41 

180 

180 

210 

12096 

25920 

18144 

-29 

- 305 

319 

2557 

10177 

413 

180 

4032 

20160 

72576 

604800 

64800 

一 11 

319 

- 58747 

19703 

239471 

39517 

210 

20160 

907200 

604800 

19958400 

9979200 

- 41 

2557 

19703 

- 220837 

1196401 

360989 

12096 

72576 

604800 

4435200 

239500800 

239500800 

91 

10177 

239471 

1196401 

- 139126639 

4577641 

25920 

604800 

19958400 

239500800 

7264857600 

10897286400 

■ 

41 

413 

39517 

360989 

4577641 

一 122953057 

18144 

64800 

9979200 

239500800 

10897286400 

21794572800 


现在构造矩阵 C 的逆 A 二 
自由度 z 的％ 2 分布。 


a 


，并计算 S ; 


QiQj 


a 


o 


对于大的 n ， 结果有近似于 


前面给出的矩阵（11)是 Q 的逆，计算至五位有效数字。真正的逆 A 是 


71 


一 1 


C 


72 


- 2/^-1 





-1 
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一 3 广一 1 


cr L c 2 c 


- 1 


c 2 c 


一 1 


，结果 C 


C 2 C 


- 1 


非常接近 


于 一 6C 


一 1 


因此 V^Q T C[ l Ql(n~6) 


H 


的极大值检验 


对于 O^/Cn ， 令 V ; = max(L7,,L7 0 + i ， 


现 


在，对于有分布函数 = 的序列 V Q ， ％ ，…， Km 应用 KS 检验 

或者，把等分布检验应用于序列 W ， W ， …， 


为验证这个检验，须证明 V ) 
的概率是且 L 7 2 < x 且 


的分布函数是 F(x) = x 


max( Ui , U 2 , 


4 蠡癱 


， U t )<x 




且 U t < x 的概率，这是诸个别概率的乘积，即 


••蠡 

uA -/ 


X 


I . 冲突检验 仅当在每个范畴中预期有非平凡个数的项时，才可进行;检验。 
但是，当范畴数比观察数大得多时，可以使用另一种类型的 检验； 这一检验同“散列” 
(hashing) 有关，散列是我们将在第6章中加以研究的信息检索的一个重要方法。 

假设有 77Z 个瓮，我们随意地把72个球投入到这些瓮中，这里 m 比72大得多。 
大多数球将落人原先是空的瓮中，但若一个球落人至少已经含一个球的瓮中，我们 
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4 

便说出现一个“冲突”。冲突检验计算冲突的次数，而且如果一个生成程序不引起太 
多或太少的冲突，则说它通过这个检验。 

为了确定这些思想，假设772=2 2() 和71 =2 14 。那么，平均每瓮仅仅接收一个球的 

1/64。一个给定的瓮恰含 A 个球的概率为九 = f 1 广〃，所以每个瓷 

\k I 

的期望冲突数为 


^j(k - 1 ) p k = ^jkp k - ^Jpk = Z" _ 1 + Po 

k>0 k^l m 


由于 pQ = (1 — m 1 ) 72 = 1 — nm 1 + 


m - 较小的项，故我们求得所有 m 个瓷 

/ 


发生的总冲突数平均比 72 2 /(2 m ) = 128 少一点点（实际的值是〜 127. 33)。 

我们可以使用冲突检验来测量在很大维数下的一个随机数生成程序。例如，当 
m = 2 2() 和72 = 2 14 时，我们可以通过令 d = 2 并对 (Xj < n 构造20维向量 V j ~ 

( 丫2~，丫20 ; + 1，…，丫2~ + 1 9)检验一个数值生成程序的20维随机性。为了确定冲突， 

保持 m = 2 2 G 个二进位的一张表，对向量的每 一 可能的值用一个二进位表示;在 

一台每个字有32个二进位的计算机上，这总计为2 15 个字。开始时，这个表的所有 
2 2 G 个二进位清为0;然后对于每个，如果对应的二进位已为1，我们就记录一个冲 

突，否则就把这个二进位置为1。这个检验也可用于^=4的10维向量，等等。 

为了判断这个检验是否通过，我们可以使用当和 n 二 2 14 时的下列百分 

点表： 

冲突 < 101 108 119 126 134 145 153 

概率 .009 .043 .244 .476 .742 .946 .989 

奠定这些概率的理论基础和我们在扑克检验中所使用的，即等式（5)，是一 样的 ； e 
个冲突岀现的概率就是 n - c 个瓮被占据的概率，即 

m{m — 1 ) … （m _ n + c + 1) I n 

m n — c 


尽管 m 和/ z 非常大，但不难利用以下方法计算这些 概率: 


算法 S ( 关于冲突检验的百分点） 给定772和 n ，这个算法确定当 n 个球散列于 
m 个瓮时冲突数的分布。为进行计算，使用浮点数的一个辅助数组 A [0]， A [1]， 

…， A [ 72 ] ;实际上，仅当时 ， A [7 ] 才将是非零的，而 _ 7。将至多有 log ” 

的阶，所以只要使用相当少的存储就可能得到它。 

S 1 • [初始化]对于置 A [^； ]— 0;然后置 A [ l ] — 1和 ji — 1。然 

后执行步骤 S 2 恰72 - 1次并转到步骤 S 3 继续进行。 

S 2. [修改概率](每对应于投掷一个球到一个瓮中就执行这步 一次； A [ 7 ] 表 

示恰有个瓷被占据的概率。）置 + 1，然后对于_ 1，…， 

(以此顺序 ） ，置 A [ j ] —( j / m ) A [ j ] + ((l + l / m )-( j /7 n )) A [ j - l ]。 如 
果随着这个计算的结果 A U ] 变成非常小，比方说 A [ j ]< l ( T 2() ，则置 
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A [ j ]— 0;而且在这种情况下，若 ， 则减 1， 或若_；=九则九加1。 
S 3. [计算答案]在这步中，利用含有我们感兴趣的百分比的一张辅助表 

丁 2, …，丁 tmaJ = (.01，.05, .25, .50, .75, .95, .99,1.00)。置户 —0， z — 1 

和 J — Jo - l 。 进行下列的迭代直到 Ftmax 为止增1，并置 p^p + A [ jl ; 
然后如果 f >7^， 则输出和(意味着至多有个冲突 
的概率是1 - /0，并重复地对〖加1直到 p < T t 为止。 ■ 


J. 生日间隔检验 George MarsagUa 在1984年引进了一个新型的 检验： 如同在 

冲突检验一样，我们把 n 个球投入到 m 个食中，但现在我们把食想像为“一年的每 
一天” ，而把球想像为“生日”。假设生日是 （ h ，…， A )， 其中 0< R < m 。 按非递 

减次序对这些生日排序 Y ⑴然后定义”个“间隔= Y ⑵- 
Y ⑴，…， j，A = Y ⑴ + m - 最后对这些间隔排序， 

S ⑴ 令 R 是间隔相等的个数，即使得 1< J <” 且 S ⑺ = S (广的下标 

的个数。当 m = 2 25 和72 =512时，我们将有 

R = 0 1 2 3或以上 

概率 .368801577 .369035243 .183471182 .078691997 

(对于这里的 m 和 n 值相等间隔的平均数应近似于1。）重复此检验，比方说1000 
次，并进行具有3个自由度的 x 2 检验，来把经验的尺和正确的分布作比较；这将告 
知这个生成程序是否相当合理地产生随机生日间隔。习题28〜习题30建立了关于 

这个检验的理论并对其它的 m 和”的值给出了若干公式。 

这样一个生日间隔检验之所以重要是由于这样一个奇怪的事实，即延搁的斐波 
那契生成程序一致地 不能通 过它，尽管它们都很好地通过其它传统的检验。[这样 

的失败的引人注目的例子是由 Marsaglia ， Zaman 和 Tsang 在 Stat . and Prob . Letters 9 

(1990) ,35-39 上报告的。]例如考虑式3.2.2-(7)的序列 

X n 二 ( X n . 2 4 + X „— 55 ) mod m 


这个序列的数满足 


X. + x._ 


n ~ 86 


因为两边都同余于 


-24 


+ X 
X . 


n — 55 


三 x 

i 

+ X 


n-24 


77 一 86 


+ X „_ 3i(modulo m 

，因此两对差相等： 


X 


w — 24 


x 


n — 31 




r? 一 86 


和 


每当 


X 


相当接近于 


-24 


X, . 

或尤 


x._ 


77—31 




n — 24 


X 


”一86 


-31 


(因为它应当是在一个真正随机的序列中）时，这 


个差有在两个间隔中出现的很好的机会。因此我们就有大得多的相等的情况。平 
均说来典型地只〜2,而不是1。但是如果我们从尺中扣除由所述的同余产生的任 
何相等的间隔，则得到的统计 f 通常确实通过生日检验。（避免失败的一个方法是 
抛弃序列的某些元素，比如说只使用 X Q ， X 2 ， X 4 , …作为随机数■，然后我们绝不取集 
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L. 子序列检验 外部程序通常成批地调用随机数。例如，如果一个程序对三 
个随机变量 x ， y 和 z 进行处理，则它可能一次就要生成三个随机数。在这样的应 
用中，重要的是由原来序列的每个第三项①组成的子序列是随机的。如果这个程序 

一 次要求 g 个数，则诸子序列 

U() ， Ug ， lJ2q ， "’; 以 1 ， + 1 ，以 2(?+1 ，…； …； LJg - I , U2q-[ y ^3g-l » * " 

中的每一个都可施以对原来的序列 L / G ， 17^172,…的上述那种检验。 

使用线性同余序列的经验已经表明，这些导出的子序列很少（如果有的话）有可 
能不如原来的序列随机，除非和周期长度有共同的大因子。例如，在 m 等于字大 
小的一台二进计算机上，对于^ = 8的一个子序列的检验，势必给出对所有 g <16 的 
子序列检验中最差的随机性；而在一台十进计算 机上， ^ = 10产生似乎最不能令人 
满意的子序列。（在某种程度上可用效能来解释，因为 Q 的这些值一般会降低效能。 
习题 3.2.1.2-20 提供了更详细的说明。） 

M . 历史评述和进一步讨论 在统计学家“证明”或“否定”关于各种观察数据的 
假设的工作中，自然地出现了统计检验。讨论人工生成的数的随机性检验早期最著 

名的论文是 M . G . Kendall 和 B . Babington-Smith 的两篇，发表在 Journa ] o / the Royal 
Statistical Society 101 (1938), 147 〜166,和该杂志的增刊， 6 ( 1939 ),51 〜61 上。这 
些论文讨论了 0与9之间随机数字的检验，而不是随机的实数的检验；为此目的，两 
位作者引进了频率检验、序列检验、间隔检验以及扑克检验，然而他们滥用了序列检 

验。 Kendall 和 Babington - Smith 也用过集券检验的一种变形；前文所述的方法是由 
R • E • Greenwood 引进的 [ Math . Comp . 9 ( 1955 ) ，1 〜5 ] 。 

运行检验有一段颇为有趣的历史。开头，这些检验对上行运行和下行运行同时 
进行 ：一个 上行运行跟着一个下行运行，然后是另一个上行运行等等。注意，运行检 
验和排列检验都不依赖于诸 U 的一致分布性，它们仅仅依赖于这样一个事实，即当 
i ^ j 时 ， R 的概率为0;因此，这些检验可以应用于许多类型的随机序列。原 

始形式的运行检验是由 J . Bienaym 6 创立的 [Comptes Rend us Acad . Sci . 81 ( Paris , 
1875)，417 〜 423]。 大约 60 年后， W . O.Kermack 和 A . G . McKendrick 发表了 关于 
这一课题的两篇综述论文 LProc . i^oyai Society Ed/jiburgh 57 (1937) ，228 〜 240，332 

〜 376]; 作为一个例子，他们指出，在1785年到1930年间，爱丁堡的雨量相对于运 
行检验说来本质上是完全随机的（尽管他们仅仅考察了运行长度的平均值和标准 
差）。若干其他人开始使用这个检验，但直到1944年，人们才发现把使用％ 2 方法与 

这一检验相联系是不正确的。 H.Levene 和 J . Woifowitz ^Annals Math . Stat . 15 
(1944),58 〜69的论文中引进了正确的运行检验（交替地进行上下行运行检验），并 
且讨论了早先滥用该检验的错误。如同在上面的正文中所指出的，对于上行运行和 
下行运行分开检验，更适合于计算机应用，所以我们没有给出在上下交替情况下更 

复杂的公式。请看 D . E.Barton 和 C . L.Mallows 的评述论文 ， Annals Math . Stat . 36 


①即每隔三项。 


译者注 
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(1965)，236〜260。 

在我们已描述过的所有检验中，几乎所有的随机数生成程序都通过了频率检验 
和序列相关检验，从这个意义上说，频率检验和序列相关检验似乎是最弱的。它们 
较弱的理论根据，将在 3.5 节进行简要的讨论（参考习题3.5-26)。另一方面，运行 
检验是一个略强的检验 ：习题 3.3.3-23 和24的结果提示，如果乘数不是太大，则线 
性同余生成程序趋于有比通常略长的运行，所以习题14的运行检验肯定是值得推 
荐的。 

冲突检验也是很值得推荐的，因为它已特别地设计成用以发现广为流传的许多 

差的生成程序的缺陷。这一检验以 H.Delgas Christiansen 的思想 [ Inst . Math . Stat . 
and Oper . Res . , Tech . Univ . Denmark (1975 年 10 月），未发表]为根据。它是在计算 

机发明之后开发的头一个检验，特别用于计算机计算，不适合于手算。 

读者大概会惊异，“为什么会有这样多的裣验？”据说，花在检验随机数上的计算 
机执行时间超过了应用这些随机数的时间！这是不真实的，尽管确有可能对检验过 
分热衷了。 

已经有大量文献论述了进行若干检验的必要。例如，人们已经发现，由平方取 
中法的一个变形所产生的某些数已经通过频率检验、间隔检验和扑克检验，但却通 
不过序列检验。人们知道，具有小乘数的线性同余序列通过了许多检验，但是对于 
运行检验却失败了，因为长度为1的运行太少了。 r 的极大值检验也已经用来探测 
出某些坏的生成程序，不然这些生成程序会被误认为可正当实施。当极大间隔的长 
度超过最大延搁时，带借位减法生成程序通不过间隔检验，参见 Vettulainen ， 

Kankaala ， Saarinen 和 AlaNissila , Computer Physics Communications 86 (1999) ,209 〜 

226,其中还报告了其它形形色色的检验。延搁斐波那契生成程序，它在理论上保证 

有相同分布的最低有效位，但仍然不能通过1位相同分布检验的一些简单的变形 
(见习题31和35,还有3.6-14)。 

也许，对随机数生成程序进行广泛检验的主要原因是，滥用 X 先生的随机數生 
成程序的人们，几乎从不承认他们的程序是不行 的：他 们将责难这个随机数生成程 
序，直到 X 先生能向他 们证明 ，他的数确是充分随机的为止。另一方面，如果随机数 
的来源仅为 X 先生个人使用，则他可能会决定不去费心来检验它们，因为本章所推 
荐的一些技术有令人满意的高概率。 

由于计算机变得更快了，因此比起以前，随机数的使用也更多了，于是曾经令人 
满意的随机数生成程序对于在物理学、组合学、随机几何等等的复杂应用说来不再 
是足够好的了。因此 George Marsaglia 介绍了一 些严格的检验 ，它们大大超岀像间 

隔和扑克检验这样经典的方法，以便满足新的挑战。例如，他发现序列 X „ + 1 = 
(62605 X n + 113218009) mod 2 29 在下列的实验中有值得注意的偏倚 ：生成2 21 个随机 
数& 并抽取它们的10个前导位 L = L &/2 19 」。 统计10位二进位数的2%个可能 

的数偶 G ，/) 中有多少在 （ Y !， Y 2 )，（ Y 2 , 乂3)，_"，（又2 21 -1，丫2 21 )当中不出现。应 
当有大约 141909.33 对不出现的数偶，并有标准差〜 290.46( 请见习题34)。但是以 
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X t = 1234567开始的六个连续的测试值产生出全在 1.5 和 3.5 之间太低的标准差 

的计数。分布有点太“平”了而不是随机的——大概是因为 2 21 个数是整个周期一个 
有意义的分数1/256。一个带有乘数69069和模数 2 3G 的类似的生成程序被证明是 
更好些的。 Marsaglia 和 Zarnan 把它叫做“猴子检验”，因为它统计一只猴子随机地 
在有1024个键的键盘上敲键，敲不到的两字符组合的个数，关于对若干个猴子检验 
的分析，请见 Comp ufers and Ma th . 26,9 (1993 年 9 月）， 1 〜 10。 

习题 

1 . [ i 0] 为什么在 b 部分中描述的序列检验应该应用于 （ y 。，70,( y 2) y 3 )， …， （ Y 2 „_ 2 , 
7 2 ，,- 1 )，而不是（7 0 ,7 1 )，（7 1 ，7 2 )，〜，（1- 1 ，八）？ 

2. [10] 指出把序列检验从数偶推广到三元组、四元组的一个适当方法。 

► 3.[ M 20] 假定序列是随机的，平均地说，在间隔检验（箅法 G ) 中找到 n 个间隔之前需要考 
察多少个 U ? 什么是这个 M 的标准差？ 

4.[12] 证明 （4) 中的概率对于间隔检验是正确的。 

5 . [ M 23 ] Kendall 和 Babingtorr Smith 所使用的“经典的”间隔检验考虑数 LTq ， L /丨 ，…， U ^~ \ 
是一个循环序列，而且相等，这里 N 是接受检验的诸 L ； 的固定个数。如果数 L / o , …， 

中有72个落入范围则在循环序列中有^个间隔。设乙是长度为 r 的间隔个数， 
其中 0< r < 〖，并设乙是长度> /的间隔的 个数； 证明在 N 趋于无穷的极限下，量 V = 

乙-以 V ) 2 /以 V 将有自由度，的 X 2 分布，其中久是式 （4) 给出的。 

6. [40]( H . GeiHnger ) 在 e = 2 .71828 …的表示中，头2000位十进数字的频率计数给出 1.06 
的^值。这说明，对于数字0，1， …， 9,实际频率太接近于预期的值了，因之不能认为是随机分布 
的（事实上，>： 2 >1.15的频率为 99.996 )。同样的检验应用于 e 的头10000个数字，给出比较合理 
的值;^ 2 = 8.61 ; 但是头2000个数字如此均匀地分布的事实仍然是令人惊异的。在 e 对于其它进 
制的表示中，是否有同样的现象？[见 AMM 72 (1965),483 〜 500。] 

7. [08] 以 d = 3 和 n =7 应用集券检验程序（算法 C ) 于序列11012210221202020012122010 
10201121，七个子序列长度是多少？ 

► 8.[ M 22] 假定序列是随机的，平均说来，在找到； 2 个完备的集合之前，在集券检验（算法 C ) 
中，有多少个 L 7 需要检验？标准差等于什么？[提 示： 见等式 1.2. 9-(28)。] 

9. [ M 21] 推广集券检验，使得一旦找到 w 个不同的值之后，即停止检索，其中 w 是一个小 
于或等于^的固定正整数。问应当以什么概率代替 （6)? 

10. [ M 23] 对于习题9中所描述的更一般的集券检验，解习题8。 

11. [00] (9) 中示出一个特殊排列中的“上行运行”，问该排列中的“下行运行”是什么？ 

12. [20] 设 ，…， 仏^是^2个不同的数，写出一个算法，确定序列中所有递增运行的 

长度。当这个算法终止时，对于 l < r <5， C 0 UNT [ r ] 应是长度为 r 的运行的个数，，而 C 00 NT [6] 应 
该是长度为6或更大的运行的个数。 

13. [ M 23] 证明 （16) 是有形式 （15) 的 p + g + 1 个不同元素的排列的个数。 

► 14.[ Mi 5] 如果“拋弃”紧接于一个运行后的那个元素，使得当：^大于\ +1 时，以\ + 2 开始 

下一个运行，则运行长度就都是独立的了，而且可以使用一个简单的/检验（代替正文中所推导 
的令人生畏的复杂方法）。对于这一简单的运行检验，什么是相应的运行长度的概率？ 
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15.[ M 10] 在、的极大值”检验中，为什么要假定％， W， …，”^在。与1之间一致分布？ 

► 16. [15] J.H.Quick 先生（一位大学生）要对 z 的各种值实施、的极大值”检验。 

a) 令&二 ma X (L7 ; ，L/ ; + 1 ，…，，他发现一个从序列 Z 0 (, _ 1} ， Z 1(r _〖），…变到序列 

…的只使用少量时间和空间的巧妙方法。他的聪明的方法是怎样的？ 

b) 他决定修改、的极大值”的方法，以使第 J 个观察虽为 maX (R ， …，换言之，他 
取％ = 而不是如正文中所说的 V ; -2 (/ j)/0 他推断，所有的 Z 都应该有相同的分布，所以，如 
果不是每次取第£个值，而是取每个 Z ; :，0<j< n， 则这个检验应该更强，但当他对于 Vj 的值试 
行一次 f 等分布检验时，却得到极其高的统计值V，当〖增大时，甚至得到更高的值V。这是为 
什么？ 

17. [M25 ] 给定任意数 ，…，，％，…，V,,— i ，令 

I 

^ ~ \ 2 ^ ^ ~ ~n 2 ^ 

n Q<k<n Q<k< n 

a) 设 U 、 二 U k - U ， V ' k = V k - Vo 证明式 (24) 中给出的相关系数 C 等于 

S w/J 2 u?J 

0<^< ;r V 0<>< /I V 0</t< n 

b) 设 C = N/D， 其中/V和 D 表示 a) 部分中表达式的分子和分母。证明 N 2 <D 2 , 因此 - 1< 
C<1; 并且求出关于差 D 2 - N 2 的一个公式。[提 示： 见习题1.2.3-30。] 

c) 如果（：=±1，证明对于某些不全为0的常数 a J 和 r， 有《(^ +戶\^ = 7*，0<々<”。 

18. [M20] (a) 证明，如果77=2,则序列相关系数 (23) 总是等于 -1( 除非分母为0)。 （b) 类 

似地，证明当72=3时，序列相关系数总等于-士。 （C) 证明，当且仅当 U 0 = Uf = H 


式 (23) 中的分母为0。 

19. [ M 30]( J . P . Buder ) 设 L / o ， “. ， U „ - !是有相同分布的独立随机变量，试证明序列相关系 

数 (23) 的期望值，对分母非零的所有情况取平均，是 -1 /U _ 1)。 

20. [ HM 41 ] 继续上一道题，试证明 （23) 的方差等于 77 2 /(n -1) 2 ( t 7 -2)- n 3 E (( L 7 0 - U { Y ! 
D 2 )/2 (n -2)， 其中 D 是 (23) 的分母而 E 表示对于 D ^ O 的所有情况的期望值。当每个 R —致 

地分布时 E (( L 7 0 - LA ) 4 /!) 2 ) 的近似值是多少？ 

21. [19] 如果对算法 P 提供排列（1，2,9,8,5,3,6,7,0,4)，问用它算出的/值等于多少？ 
22.118] 如何排列整数 K )， l ，2,3,4,5,6,7,8,9 l ，才能使算法 P 产生值/= 1024? 

23 . [ M 22 ] 设〈八〉和 〈 Yj 是分别有周期长度 A 和； T 的整数序列，且0< KCd ; 还设 
' Z n = ( Y n + Y ； + r ) mod d ， 其中 r 是在 0 和 A ' _ 1 之间随机地选择的 。试证明，在下列意义下 

〈&>至少也像〈八 >一样好地通过 z 维序列检 验：设 P (〜，…， a ) 和元组 

( a ，…，: c 》 在〈\〉和 〈 z „〉 中出现的概率： 


A-1 


P ( X { ，… yX t ) 


2 [( Y ” ，…， Y « + H) = (XI ， …， X £ )] 


n 


A-i y-i 


Q (工 \ ， 


X 


XX 


= (ii ， …，工 J ] 


n 


0 


W \ 2 ~ ^"') 2 ^ S ( P (^： i ， …，而） - f ) 2 

(Xj ,X ( ) i^ { 

24. [ HM 35 ] ( G . Marsaglia ) 试证明对于 n 个重叠 f 元组 （ Yi ，，…， L ) ， （ Y 2 ，丫3，…， 
1 +1 )，〜，（¥„，7 1 ，〜，1 — 1 )的序列检验可如下进行 ： 对于每个满足的串 a = q …〜, 
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令 NU ) 是 a 作为 Yi HR 


m m m 


Y 


m 


的一个子串出现的次数，并设 PU ) 


«出现在任何给定的位置的 概率; 个别的数字可以以不同的概率 P (0), P (1), 
计算统计 


P(a,)- 
“， P(d 


_ 1) 出现， 


V 


n 


2 


1 Q \ 


N ( a ) 

P(a) 


n 


2 


io I 


N(a) 

PUT 


那么当 w 很大时 V 应有自由度为 


-1 


的％ 2 分布。[提示，使用习题 3.3. 1 - 25 


25.[ M 46] 当 Q 和（： 2 是（22)之后定义的矩阵时，为什么 C 「 1 C 2 C 「 1 〜 - 6 C 


26‘[ HM 30] 设 U ly U 2 




, U n 是在[0，1)中的独立一致偏离，并设 U ⑴ 


是排序之后他们的值，并定义间隔 S 


U ⑵ - U 


(1) 


，…， S ” 


U 


( n ) 


- U 


( n - i ) 


， s „ 


Un 


( l ) 



1 _ 


及和生日间隔检验一样间隔… < S U ) 。 在下列的计算中使用记号/+作为表达式 
x n [ x ^ O ] 的缩写。 


a ) 给定任何实数 ^， s 2 , 


，&，证明联立不等式8^5^52^52 


， S n > s ri \IL(1 ~ s 


^2 


J 


M _ 1 


的概率出现 


b ) 结果最小的间隔 s ⑴以 i-(i -似）”， 1 的概率小于等于 s 

c ) 对于什么是分布函数 F 山）二 P r ( S ⑴ 

d ) 计算每个 S u ) 的均值和方差。 

► 27.[ HM 26] (迭代的间隔）在上题记号下，证明数 S^TzSn 


⑴， 




n - 1)( S ( 2 ) - S 


( 1 ) 


S ； 


i(s 


(”） 


Su - u )* «个一致偏离的原来的间隔 A ，…，有相同的联合概率分布。因此我 


们可以对它们进行排序， 


蠡 ■ ■ 


，并重复这个转换来得出另 


个随机间隔的集合 


S 


，€等等。使用 


K 


n — 1 




n — I max — r 

\^ ： j<n\n — X 


s ( / } - 



⑴ 


K 


72-1 max { S \ k ^ + + Sj 

0< « \ 


(k) 


n — I 


每个逐次的间隔 sS ^ } , 
况下详细考察从 （ Si ,• 


, S ( / ) 的集合都可经受 Kolmogorov - Smirnov 检验。在 n =2 和的情 




,51) 的转 换：说 明当把它应用于具有有限精度的计算机生 


成的数时，为什么连续重复此过程最终要崩溃。（比较随机数生成程序的一个方法是看它们对于 
这样的折磨检验，能继续生存多久。） 

28 •[ A 犯 6] 设 6_( m ) 是满足 0<~< m 的 n 元组（力，…，％)的个数，它们恰有，个相等的 


间隔和 s 个零间隔。因此，在生日间隔检验中 R = r 的概率是 


nrs 


m)i m n 0 还设 />„(» 2 ) 是 


把 m 分划成至多 n 个部分的分划数（见习题 5.1.115)。（ a ) 用分划表达6, 00 ( m ) 


[提示：考虑 


有小的 m 和^2的情况。] ( b ) 证明，当 s 〉0 时 6_( m ) 和 卜以 （ m ) 之间有一个简单的关 
系。 （ c ) 试推导没有间隔相等的概率的公式。 


29. [ M 35] 继续习题28,试求当 r = 0,1,2时，对于生成函数6 




nr 


E 


m ^0 ^nrO \ ^ / ^ 


m 


m 


的简单表达式。 

30.[ HM 41 ] 继续上道题，证明如果772 


n 3 / a ， 当 n 


oo 时对于固定的 a , 我们有 


PA 


m 


m ”- V ’ 4 / _ 13 o ^ 169 a 

n ! ( n - 1)! 1 288 n 



2016a 3 - 1728a 2 - 41472a 


165888 n 2 


+ 0 ( 72 


-3 


求对于 〜（ m ) 的一个类似的公式，这里9„(»2)为把讲分成72个不同的正的部分的分划数。推导 

生日间隔检验发现只等于 0，1 和2到 0( l / n ) 之内的近似概率。 
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► 31. [ M 21] 递推式 y r] = ( Y 77 _ 24 + Y _ 55 ) mod 2描述延搁斐波那契生成程序 3.2.2-(7) 的 
最低有效位以及 3.2.2 - (70 的次低有效位，已知有周期长度2 55 - 1 ;因此位 （ 7„ + 1 , 

八 + 54 )的每一个可能的非零模式同样经常地 出现。 尽管如此，试证明如果在周期中的一个随机 

点开始，我们生成79个连续的随机二进位八 ，…， 匕 + 78 ，则1的个数比0多的概率大过51%。 

如果我们使用这样的二进位来定义一个“随机的走动”，即当二进位是1时则向右移动，而如果二 
进位是0时则向左移动，则我们将以大大超过一半的时间在我们出发点的右边结束。[提示 ：求生 

成函数 2! t 0 Pr ( K + …+八十 78 二々） A ] 

32.[ M 20] 真或假 ：如果 X 和 Y 是具有均值0的独立相等地分布的随机变量，而且如果它们 
更可能为正，则 X + Y 也是更可能为正的。 

33 . [ HM 32 ] 当 k ^>2 L 且递推式 Y n — ( V „ - / + Y n _ ^ ) mod 2的周期长度是 2* - 1，并假定々 

很大时，试求由这个递推式生成的々+ /个连续的二进位中1的个数多于0的个数的概率的近似 
值。 

34 . [ HM 29 ] 试说明如何估计在一个 m 个字母的字符集上长度为 n 的一个随机串中两个字 
母的组合不连续地出现的个数的均值和误差。假定 m 很大并且 n 〜 2 m 2 。 

► 35 . [ HM 32 ] Q . H . Lindholm , 1968 ) 假设对于 〜，."，々 的某个选择使用递推式 

^ n = 2 + …+ -々 ） mod 2 

我们生成随机二进位 〈八〉 ，使得周期长度是1;以 ％ = 1 和 A = …二 ¥^=0开始。令& 

=(-1)\ + 1 二2八-1是一个随机符号，并考虑统计乂 = Z „ + Z ，, + l + …十乙+^,，其中 n 是这 
个周期中的一个随机点。 

a ) 证明 E 心 = m / N ， 其中 N = 2 k - 1 0 

b ) 什么是 ESi ? 假设 m < N 。 提 示：请 见习题3.2.2-16。 

c ) 如果诸 Z 真正地随机，则 ES W 和 ESi 将如何？ 

d ) 假定 试证明 = m 3 / JV -6 B(N + l )/ N ， 其中 


e ) 


B 二 〉: [( 十 I Yf. + 2 … + )2 = ( Yj 十 1 Yj_ + 2 … + 卜 1 )2 ] ( m _ j ) 

0 < 1 < ； < m 


计算在习题 3 i 考虑的特殊情况中的 B:m = 79 和 y „ = ( y n - 24 + n - 55 ) 


mod 2 0 


3.3.3 理论检验 


尽管利用上一节的方法，总可能检验任何随机数生成程序，但是如果有一些先 

验的检验 ，即能预先告诉我们这些检验的结果将会是如何的理论，那就更好得多。 

这样的理论要比经验的、反复实验的结果更能增进我们对生成方法的理解。在这一 

小节，我们将更详细地研究线性同余 序列； 如果在我们实际生成这些数之前就知道 

某些检验将有什么结果，则我们就有更好的机会来适当地选择 a ， m 和 c 。 

尽管已经取得了某些进展，发展这一类型的理论却十分困难。至今所得到的结 

果一般都是关于对 整个周期所做的统计检验。 当把统计检验应用于整个一个周期 

上时，并非所有的统计检验都有意义——例如，用等分布检验所得出的结果就太理 

想化了 然而，序列检验、间隔检验、排列检验、极大值检验等方法却能有效地进 

■ 
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行分析。这些研究将用来检验一个序列的全局非随机性，即在非常大的抽样中的不 
适当行为。 

我们将要讨论的理论是十分富于启发性的，但它并不排除通过 3.3.2 节的方法 
检验局部非随机性的必要。确实，证明关于短的子序列的任何有用的性质看来都是 
极其困难的。关于线性同余序列在比一个全周期短的区间上的特性仅仅知道一些 
理论结果；这些将在 3.3.4 节末尾处讨论（也见习题18)。 

让我们从对于最不复杂的排列检验的情况，证明一个简单的先验法则开始。第 
一个定理的要 点是: 假定序列有高的效能，则大约有一半的时间有 X „ + 1 < X „。 


定理 P 设 a ， c 和 m 生成一个极大周期的线性同余序列；设 b = a - 1，并设 d 是 
m 和 b 的最大公因子，则 X n + [ < X n 的概率等于112 + r ，其中 

r = (2 (c mod d ) — d ) l 2 m ( 1 ) 

因此 \ r \ < d /2 ?n o 

证明这个定理的证明涉及某些技术，这些技术本身就是有趣的。首先，定义 

s ( x ) 二 (ax + c ) mod m (2) 

于是，尤 + 1 = s ( X „)， 定理归结为计算使 0<: r < m 和5(: r )<: r 的整数： r 的个数，因 
为每个这样的整数皆出现于周期中的某处。我们要证明这个数是 




2 


m 



2 (c mod d ) - d ) 


⑶ 


当 


x 


> 


s 


: C ) 时，函数「（: c - s ( x ))/ m 1 等于1，否则它为0;因此我们希望计算的 


个数可以简单地写作 


2 

m 


X 


- s(jo)' 


m 



0^x< m 


X 


ax + c 


m 


m 


ax + c 


m 



0 ^ x < m 


ax 



c 


m 


bx + c 


m 


(4) 


(回想「 





- Ly 」 及 6 = a -1。） 通过习题 1.2.4-37 的方法可以计算这样的和式， 


在那里我们已经证明当 h 和々是整数且々>0时， 


2 

0^j<k 


hi 



c 


k 


(h ~ l)(k - 1) 


2 



2 



g 


c 



g 


gcd(/i y k ) (5) 


因为 a 与 m 互素，故由此得出 


I ： 

0^ j ： < 


m 


ax + c 

(a - l)(m - 1) 

_ Tn _ 

_ 2 + 


c 



0^X< 7t\ 


bx 



c 


m 


(b 




1)( m — 1) , d — 1 

-十— 


2 


2 



c - (c mod d ) 


因此，立即得出 （3)。 


定理 p 的证明指出，假设我们有能力满意地处理含有 u 和 n 函数的和，则确实 
可进行预先检验。在许多情况下，处理底限和顶限函数最强有力的技术是以两个稍 

微更对称的公式来代替它们 
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S(x) 


X 



1 - 


X 


X 


是整数] 


( 6 ) 


(( x )) = X -L ^」 一 


2 ^8{x) = X - \ X 



2 




2 


汐（工） 




x - j ( L 工 



X 


⑺ 


后一函数是在研究傅里叶级数时熟知的“锯齿”函数，它的图形如图7 所示。 选择 


2 


图7锯齿函数 （（ a :)) 


((^))而不选择 Lx 」 或 「: r 1 的原因是 （（2)) 具有若干非常有用的性质 


((- X )) = - (( x )) 


(( 


X 



n 


)) 


(( x )) ，整数 n 


( 8 ) 

⑼ 


(( 


nx 


)) 


((x)) 



X 



1 



+ 


n 


x 



n 


-iw 




n 


整数 n > 1 (10) 


/ / 


(见习题 1.2.4-38 和 1.2.4-39( a ， b ， g )。） 

为了得到用这些函数进行工作的某些实践经验，我们再次证明定理 P , 这次不 
依赖于习题1.2.4-37。借助于等式（7)，（8)，（9)，我们可以证明 


X - s(x) 


m 


X — s(x) 


X - s ( x ) 


+ 


m 


m 


2 


_ / X - s(x) 


2 


m 


x 


- s(x) 


x - {ax + c) \ \ 


m 


m 


) 



2 


x 


— s(x) 


+ 


bx c \ 


m 


m 


+ 


2 


( 11 ) 


因为 （: c - s { x )) jm 绝不是 一 个整数。现在 


2 

0^x< m 


X 


— s(x) 


0 


m 


因为工 和 sU ) 都取… ，1, …， m - l 丨的每个值恰一次，因此由 （11) 得出 



0^ x < 


m 


x - 5( x)l 


m 



Q^x < m 


bx ^ c\ \ x m 

^r)r~2 


( 12 ) 


令 6 




b 0 d y m = mW ， 其中心与，互素。我们知道，当 x 从 0 变到 mo _ 1时， 


( box ) mod o 以某一顺序取数值 1 0，1， 


饥 0 


(b(x 771 q) C \\ 


m 


l ! o 由 （9) 和 （10) 以及 


(bx + c \ \ 


m 


这一事实，我们有 
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0< x < 


bx 



m 


d 2 


bx 



0< 


m 


d s 

CX-T < ^ 


c ■ b 0 x 
+ 

mm 


d 


d 


(13) 


由 （12) 和 （13) 立即得到定理 P 。 

定理 P 的一个推论是，实际上，除了对于那些有很大的 d 的情况， a 和 c 的任何 
选择都将给出 X „ + 1 < X „ 的合理概率，至少对于整个周期是如此。很大的 d 值对应 

于低效能，而我们已经知道低效能的生成程序是不合意的。 

下一定理给我们提供了选择 a 和 c 的更严格的条件，我们将考虑应用到整个周 
期上的序列相关检验。在 3.3.2 小节，式 （23) 定义的量是 


C 


m 


2 

0< x < 


xs 


(x) - 


z 

0<^< 


X 


m 


2 


X 




0< jt < 


X 


(14) 


设: r 7 是使得 s ( 〆 ) 


0 的元素，我们有 


(: r) 


ax 





m 


m 


+ f [工关 /] 


(15) 


借助于和数 


a 


(a ， 々 ， 


12 2 


丄 




0<j<k 




(16) 


可以最容易地表达我们有待导出的这些公式。这个和数是在若干重要的数学问题 
中出现的一个重要函数，它称做广 义戴德金和数 ，因为 Richard Dedekind 于1876年 


在评述 Rkmann 的一篇未完成的手稿时引进了函数 a { h y k ,0) 
Gesammelte Math . Werke , 第 2 版， （1892) ，466〜478。_ 

利用已知的公式 


[见 B.Riemann 的 


7 >\ 


m { m 


x 


-1) 


2 


及 




m \ m 




2 


)( 


m 


-1) 


x 


m 


3 


很容易把式 （14) 变换成为 


C 


mo — 3 + 6 (m — x — c ) 


m 


-1 


(17) 


(见习题 5。） 因为 m 通常很大，所以可以拋弃阶为 1/ m 的项，因而我们有近似值 


C ^ a(a y c )1 


m 


(18) 


而且误差的绝对值小于 61 m 0 


序列相关检验现在归结为确定戴德金和数的值 


o 


从其定义式 （16) 


直接地计算 ， c )， 几乎一点也不比直接计算相关系数容易，但幸而有简单的 
方法可十分迅速地计算戴德金和数。 


引理 B (戴德金和数的“互反律”) 
而且如果 h 与 k 互素，则 


设 h ， k ， c 为整数，如果 ( Xc < k ，0< h < k ， 
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e(h y c ) ~ 


c 




_ c mod h ^ 0] 


证明我们把对 


o 


( h ， k , 


c 



a(k y h , c 


( j(h y k yO ) + ( j(k y h ,0) 



6 c 


2 


hk 


(19) 

( 20 ) 


6 — - 3 e(h , c ) + 3 (21) 

n 

的证明留给读者（见习题 6)。 现在仅须在 c = 0 的情况下证明引理足矣。 

我们的证明以单位的复数根为基础，它主要归功于 L . CarUtz 。 实际上，有一个 
仅使用和数的初等操作的更简单证明（见习题 7) ——但下边的方法展示了对于这 
类问题可利用的更多的数学工具，因此它更有用处。 

设 /( x ) 和 g ( x ) 是如下定义的多 项式： 

fix ) = 1 + :r + …+ x k ~ x = ( x k - l ) i(x - 1) 

g ( x ) = x + lx 1 + … + (々-1)工々 _1 = xf { x ) = (22) 

kx k I(x - 1) - x ( x k - l)/(:c - l ) 2 

如果 o ； 是单位的第々个复根 e 2 niM ， 则由式 1.2.9-( 13) 有 

\ ^ aj ~ jr g ( a / x ) = r ^ r , 如果0<厂〈左 (23) 

^ Q ( j<k 

置 ： c = l ; 若 J 关0则 g ( W ： c ) = 々/( W -1)，否则它等于 Hk - l ) l 2。 因此 

厂 mod ^ = X / T 1 + \^ k — 1)， 若 r 为整数 

0 < j<k cur — 1 jL 

(式 （23) 表明，当时，右边等于 r ， 而且即使 r 加上々 的倍数它也不变。）因 
此 



1 




(D 


厂 


Q< i<k 


a / — 1 




(24) 


这是个重要的公式，只要「为整数它就成立，它使我们得以把涉及 （（wo) 的许多计 
算归纳为包含1 的第々 次根的和式，而且它将引进一整套全新的技术。特别是，当 
A 丄》时我们得到如下的 公式： 


(7( / l ，々，0) 



3 (k — 1 ) 


12 



2 





CO 


ir 


OJ 


)h 


0 < r<k 0 < i<k 0 < j<k 


CO 


— 1 a/ 7 — 1 


(25) 


通过对 r 求和，可以简化这公式的 右边； 若 s mod 々关 0,我们就有 So 
f ( cv s )=0 o 式 (25) 现在归结为 


^ r < k co 


rs 


( j(h y k yO ) 



3 (k - 1) 


12 





1 


0 < i<k 


O ) 


jh _ 


- 1) 


( 26 ) 


用？ 


e 27dM 代替⑺，可对 J(H0) 得到一个类似的公式 


o 
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对于 (26) 中的和式我们能做什么并不是显然的，但是根据这个和数的每项都是 
^的一个函数（其中 O < j </0 这一事实，却有一个很好的方法可用；因此这个和实 
质上是对单位的不等于1 的第々 个根进行的。每当： ci ，： c 2 , …，；为不同复数时， 


我们就有恒等式 


2 


1 


X 


工1 


)•"( 


X 


X；- 


i)( 


X 


X 


,)( 


X 


工1+1 




X ： 


X 


n 


1 


X 


x x ) 


蠡_ _ 


(x 


X 



(27) 


这是由通常的把右边展开成部分分式的方法得出的，而且，如果 7( 

—: y 2 ) …（工一: y w ) ，则有 


X 


(x - y { )(x 





; - : yi ) …（为—为- 1)( 为 


%+1)… 
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这个恒等式通常可用来简化像 （27) 左边那样的一些表达式。 






(28) 
互素时，数 


0J , CO 


CO 


k 一 


、以 2 , 


■ 齡 ■ 


X 


- 1 


都是不 同的； 因而我们可以在多项式 U 


0 J 


) 


蠡§ ■ 


(x 


CO 


l )(x - 0 … （x - f — 1 


X 


- l )( x h - l ) l ( x - l ) 2 的特殊情况下考虑 （27)， 得 


到下列工的恒等式 


h 




- 1 ) 


2 


0< j<h 


(0 — 1)(工 -? j ) 



k 



oJ (oJ 


2 


Q<j<k 


( ( J k — — a /) 


x 


— 1) 


2 


X 


h 


- 1 )( 


X 


k 


-1) 


(29) 


这个恒等式有许多有趣的推论，它导出许多像式 (26) 中那样的和式的互反公式。例 


如，如果我们对 


2 


h 


X 微分 (29) 两次，并设 

阶 - I ) 2 



0 < j<h 


( ^ - 1)(1 - 


JC — 1，则得 


2 

0 < j<k 


2 




(W - 1) 


k 


( (J h 一 1)(1 — a/) 


1 


6 \ k 


/? Iz 
+ — + 


h 


hk 


+ 


2 


2 h 


2 k 


在这些求和中用 h — j 和 A - j 代替 j ，并使用 （26) 得到 



o{k Ji ,0) 



3 (/i - 1) 

h 


1 




a(h j k jO ) 



3 (k - 1) 

k 


1 丨 h i k 丄 1 、 

十 ~~ 十 



k 


h 


hk 


1 



2 


2 h 


2 k 


它等价于所求的结果。 


引理 B 给了我们一个显函数 / U ， U ， 使得当 0< h ( Kc < k 及 h 与 kl 
素时， 

a(h ,k , c ) - f(h ,k , c ) - ( j(k ,h y c ) (30) 

由定义 （16) ，显然 

o ( k 、 h ， c ) = a ( k mod h ， h ， c mod A ) (31) 

因此，我们可以迭代地使用 （30) 来计算并使用欧几里得算法简化参数。 

当我们更仔细地考察这个迭代过程时，就出现进一步的简化。让我们置 饥1 = 
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k 、 7712 


h , C 


c ，并做成下表: 


m 


m 2 




m 3 




a \ mi + 

^2 m 3 + m 4 

a 3 m 4 + m 5 




b \ m 


2 



C 2 


[I 


^3 


^2 m 3 ^ c 3 


3 m 4 + c 4 



(32) 


m 


4 


a 4 m 


c 4 


b 4 m 



c 5 


这里 


a 






m ： mod m 


yi ， 


bj — \_Cji m J + i\ 

c J + i = Cj mod 


(33) 


m 


+ 


而且由此得出 


0 < m J ^ 1 < 


m 


0 ^ c ； < 


m 


(34) 


为方便起见，我们已经假定在 （32) 中，在四次迭代之后欧几里得算法 结束； 这个假定 
将揭示在一般情况下成立的模式。因为开始时/ I 和 々互素 ，所以在式 （32) 中我们必 


定有 m 


1和 c 5 


0 


我们进一步假定 c 3 #0 而 c 4 = G ， 以看看这对于递推式有什么影响。等式 （30) 


和 （31) 得出 


a 


( h ， k ， 


c 


a ( m 2 , m ly c 1 )= 

, c x ) - 

f ( m 2 , m ly c [ ) - /( m 3 ， m 2 ， c 2 ) 



/(m 4 , 


m 


， c 3) - /(饥5, 


m 


4 


yC 4 ) 


式 （19) 中的 /( HO 的公式之头一部分 AM + AM 对总和贡献了 


m 2 


m 


m 



m 


l 


m 1 


m 2 


+ m A + m 3 


m 3 


m 


m 4 


m 4 


m 


m s 


它可简化成为 


h 


肌 3 


m 2 


k 


饥 4 + 


ms 


m 2 


m 3 


m 4 




m 


h 




a 


^2 + a 3 


CL 4 


式 （19) 的第二部分 l / M 也有一个简单的 贡献; 根据等式 4.5.3-(9) 和 4.5.3 小节的 
其它公式，我们有 


/72 ! m 2 


饥2饥3 


+ 


h 




m 4 ms 


k 


- 1 


(35) 


其中 f 是满足 


h，h 


(modulo k ) ， 0 < h " k 


(36) 


的惟一整数 


把所有贡献加起来，并记住我们的假定 


c 4 


0( 使得 e ( m 4 , c 3 ) = 0,参 


考式(20))，借助于假定的表(32)，我们求得 


(J ( h J k y c) = ； + (ai — “2 + — (24) — 6( 厶 1 ~ 心 2 + 




" b 4 ) 



6 




rrii m2 


m2 饥 3 


+ 




m 3 m 4 


m 4 m 5 } 



2 
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一 般来说有如下的类似结果: 


定理 D 设 He 是整数，弁有 0< A < M 3< C<L 且 A 与々 互素。 按上面式 


(33) 中定义的方式构造“欧几里得表”，并假定此过程在 t 步之后停止并有 m t + l 


o 


设 S 是使得 


S 


Q 的最小下标，并设 h ' 由 （36) 来定义，则 


a 


(k yk , 


h 



w 



+ 


2 (- 1) ； + 1 


a 


— 6 b. + 



+ 




m：m 


3(( - 1) 


s 



心 i ) _ 2 十 （_ 1) ’ 


在 4^.3 小节中仔细地分析了欧几里得算法 


\~M a x ， a 2y …， a 


称做 / iM 的部分 


商 


定理 4.5.3 F 告诉我们，迭代次数 


绝不会超过 b 以幻因 此戴德金和数可很快 


地计算。项3/ 


m：m 


可进一步简化，习题17是计算的 




个有效算法。 


既然我们已经分析了广义戴德金和数，就让我们应用已有知识来确定序列相关 


系数。 


例1 

解 


求当 


m 




35 


2'a 




2 3 



lyC 


1时的序列相关性 


o 


由等式 （17) 我们有 


C 


(2 35 ct(2 


34 



1，23 5 ，1 ) — 3 + 6(2 


35 


- (2 


34 


一 1 ) 一 1 ))/( 2 70 - 1 ) 


为计算 


a 


(2 


34 



1，2 35 ，1)，我们可以构造表 


m 


2 


35 


^1 


m 2 


2 


34 



a 


ci 





m 


2 34 - 1 


a 2 


Cz 



0 


m 4 


2 


m 


a 3 

CL 4 


2 33 - 1 


c 4 


b\ — 



2 


C 5 


由于 V 


2 


34 



，根据定理 D ， 这个值为2 33 - 3 + 2 


0 

-32 



于是 


C 


(2 


68 


5)/(2 


70 


4 


十 f ， 


2 


-67 


(37) 


这样的相关性对于随机性而言太高了。当然，这个生成程序的效能非常低，因 


而我们已经把它看做非随机的而拒绝了。 


例2 

解 


求当 


m 




10 


10 


>a 




10001, c 


2113248653时的近似序列相关性。 


我们有0々^(、772/)/肌，且计算过程如下: 


m | 

二 10000000000 




m 2 

= 10001 

^1 = 

= 999900 

c 2 = 

m 3 

= 100 

a 2 = 

100 

c z 二 

m 4 

二 1 

a 3 = 

= 100 

= 


2113248653 

7350 


cr v rni y m 


c { ) =- 31.6926653544, 


50 

0 

C 3 


bi 

△3 

10 


211303 

73 

50 


-9 


(38) 


这确实是 C 的非常不错的值。但是这个生成程序的效能仅为 ?> 、所以虽然它的序列 
相关性很低，却不是随机数的好来源。 序列相关性低是必要的但不是充分的。 
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例3 对一般的 a ， m 和 c 估计序列相关性。 

解如果我们仅仅考虑式 （30) 的一个应用，则有 




由习题12，现在|(7(771，^，0)|<0，因此 

o + ， m ， C ) 义丄卜一丄 + “ 丄 ) 2 ) (39) 

m a \ m \m J / 

在这个近似中，误差绝对值小于 U +6)/ m 。 

(39) 中的结果是关于同余生成程序的随机性已知的头一个理论结果。 R . R . 
Coveyou[/ACM 7 (1960) ，72〜 74] 通过对0和 m 之间的所有实数取平均值而不 
是仅仅考虑整数得到了这个结果 （参 考习题 21); 然后 ， Martin Greenberger [Ma th . 
Comp . 15(1961)，383 〜 389] 给出了包括一个误差项估计的严格推导。 

于是开始了计算机科学历史上最可悲的章回之一！尽管上面的近似十分正确， 
但在实践中它却使人伤心地被滥 用了； 人们摈弃了他们正在使用的极好的生成程 
序，而以从 (39) 的观点看像是好的而实际上却是糟糕的生成程序代替它们。有十年 
以上，仅仅由于理论发展的原因，日常使用的最普通的随机数生成程序严重地缺乏。 


A Little learning is a dang rous Thing . 

学习太少是一件危险的事情。 

Alexander Pope ,An Essay on Criticism ， 215 (1711) 

如果我们要从过去的错误中学习，那么最好仔细地考察一下 （39) 是怎样被滥用 
的。首先，人人漫不经心地假 定：如 果在全周期上的序列相关性很小，则将是随机性 
的一个很好的 保证; 但是事实上，甚至对于这个序列的1000个连续的元素，序列相 
关性都不能保证是小的（参见习题14)。 

其次，仅当 a 〜 A 时， （39) 和它的误差项才确保相对小的 C 值； 因此，人们提 

议选择接近的乘数。事实上，我们将看到，几乎所有的乘数都给出实质上小于 

1/ xZ : 的 C 值，因此， （39) 不是对于真正的特性的一个非常好的近似，极小化 C 的一 
个粗略的上界并不极小化 C 。 

第三，人们发现当 

cl m 七去 ± \ /3 (40) 

2 6 

时， （39) 给出最好的估计，因为这些值是 1-6 ：t + 6 ： t 2 = 0 的根。“在不存在选择 c 
的任何别的准则时，我们倒不如用这一个。”这个说法并非错误，但却会误导人们，因 
为经验已经表明，当 a 是一个好的乘数时 c 的值几乎对序列相关性没有任何 影响; 
(40) 的选择仅在像上边的例2的情况下才能大大地简化 C 。 而且，在这样的情况 
下，我们已在愚弄自己，因为坏的乘数将在其它方面暴露它的缺陷。 

显然，我们需要一个比 （39) 更好的 估计； 而且由于定理 D ， 现在已有这样的一个 
估计可用，它主要是从 Ulrich Dieter 的工作导岀的 [Math. Comp . 25 (1971) ，855〜 
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883]。 定理 D 意味着，如果 al 7 n 的部分商很小，则 cj( a ,m , c ) 也将很小。 确实，通过 
更加仔细地分析广义戴德金和数，有可能得到十分精确的估计。 

定理 K 在定理 D 的假设之下，我们总有 

2 a ； + y 2 a ； _ y ( 41 ) 

j 奇 j 偶 j 偶 

证明见 D _ E . Knuth ， Acta Anthmetica 33 (1978)，297 〜 325 ，其中进一步证明 
了当有很大的部分商时，这些界实际上是最好的。 ■ 

例 4 对于 a = 3141592621, m 二2 35 ， c 为奇，估计序列相关性。 

解 aim 的部分商是 10，1，14，1，7，1，1，1，3,3,3,5,2，1，8,7，1，4，1，2,4,2;因 
此由定理 K ， 

— 55 ^ a{a ,m , c ) ^67.5 

因此，保证了对于所有的^序列相关性是极低的。 

注意，这个界比我们能从 （39) 得到的要好得多，因为 （39) 中的误差的阶为 a / m ; 
我们的“随机”乘数比根据 （39) 特别选择的看起来好的乘数要好得多。事实上，有可 
能证 明：对 所有同 m 互素的乘数 a 来说， … 的平均值是（见习题 4.5.3-35) 

$(ln m ) 2 + 0(( log m)(log log m ) 4 ) 

因此，一个随机乘数有很大的，比如说对于固定的 e >0, 大于 （bg m ) 2 —， 当 

w — 〜时，其概率趋于0。这体现了这样一个经验论据，即在整个周期上几乎所有线 
性同余序列的序列相关性都极低。 

以下的习题表明，其它一些预先检验，例如在整个周期上的序列检验，也可借助 
于一些广义戴德金和数来表达。从定理 K 得出，假定某些确定的分数（依赖于 a 和 
m 而不依赖于 c ) 的部分商很小，则线性同余序列将通过这些检验。特别是，习题19 
的结果意味着当旦仅当 a/m 的部分商不是很大时，成对的序列检验将被满意地通 
过。 

Hans Rademacher 与 Emil Grosswald M&^}Dedekind Sums —书 （ Math . Assoc , of 

America,Carus Monograph No . 16,1972) ，讨论了戴德金和数的历史与性质及它们的 

推广。 3.3.4 小节讨论了进一步的理论检验，包括在较高维上的序列检验。 

习题—— 第一组 


1 . [ MJ 0] 借助于锯齿函数与5函数表达 “： r mod y ’。 

2. [ HM 22] 什么是函数 （（： c )) 的傅里叶级数展开式（借助于正弦与余弦）? 

3. [ M 23]( N . J . Fme ) 证明对所有实数: r , + Y ) ) < ^ 
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► 4.[ M 19] 如果 m = 10 '假 定生成程序的效能为10,则 d 的最高值是多少(用定理 P 的表示 
方法）？ 


5. [M21] 推导出式 （17) 来。 

6. [ M 27] 设 hh ' + kk^lo 

a ) 不使用引理 B , 证明对于所有整数 c >0, 


<y(h ,k ,c) = (y(h,k ,0) + 12 ^ ((^)) + ^((^)) 

0 <; < c 

b) 证明如果 ()<_；<々， 



c ) 在引理 B 的假定下，证明式 (21)。 

► 7.[ M 24] 当 c = 0 时，利用习题 1.2.4-45 的一般互反律给出互反律 （19) 的一个证明 

► 8.[ M 34]( L . CarUtz ) 设 


p(p,q 9 r) 




12 2 

0^ i < 






通过推广引理 B 中所用的证明方法，证明下列由 H . Rademacher 给出的漂亮恒等式 ：如果 p y q 
中每一个都与其它两个互素，则 


r 


p(p 9 q,r) + p(q,r y p) + p(r y p y q) 


= A + j + 工 


qr 


rp 


PQ 


3 


(c = 0 时的戴德金和数的互反律是 r = l 的特殊情况。） 

9. LM40] 沿着习题 7 中那个特例的证明路线，能否给出 Rademacher 恒等式（习题 8) 的一个 
简单证明？ 

10. [ M 20] 证明当 0</ i < A 时，有可能很容易地借助于来表达 cxU _ / i ，々， c ) 和 

(j(h , k y _ C) O 

11. [M30] 正文中给出的公式说明当 / i 与々互素时，如何计箅对于一般情况， 

证明 


a ) cr (< i / i ，<^，< ic ) = ^ r (/ i ， A ， c )， 整数 d ^>0\ 

b) j(/i，々，c + 沒）=^7(八，走，(：）+6((/17/々）），对于整数〔，实数0<沒<1,人丄6且 A/i /三 l(mod- 


ulo O O 

12. [ M 24] 证明如果 / i 与々互素且 c ： 是整数，则1^7(/1，々^)|<(々-1)(々-2)/々。 

13. [ M 24] 推广等式(26)，使得它给出 a ( K ， c ) 的一个表达式。 

► 14. [ M 20] 对于有 m= 2 35 ,a = 2 l8 + l,c = l 的线性同余生成程序，对它进行三批有1000个 
连续的数的序列相关检验。而且在每种情况下，在 0.2 和 0.3 之间，结果有非常高的相关。取遍 
周期的所有2 35 个数，问这个生成程序的序列相关是什么？ 


15. [ M 2]] 推广引理 B 使得它能应用于所有 c 的实数值 ,0< c <々。 

16. [M24] 给定 （33) 中定义的欧几里得表，令，且对于，岛=~巧 

PH 。 证明定理 D 中的和式的复杂部分可以重写如下，以避免非整数 计算： 


2(- iv +1 


c 


J 






m 


2(-W 


c 



c 




、 Pj- 


1 


[提 示：证 明对于我们有 -1) 


J 


I 


m；m 


一 l ) 


Pr - \l 


m i m r + 
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17.[ M 22] 试设计一个算法，它对于满足定理 D 的假设的整数 Hc ， 计算 ct ( AJ ， c )。 你 
的算法应当只使用（未限定精确值的）整数算术，而且它应当以 A + 的形式产生答案，其中 A 
和 B 是整数（参考习题16)。如果可能，只使用有限个变量临时存储，而不使用像…，〜这 

样的数组。 

► 18.[ M 23]( U . Dieter ) 给定正整数 Hz ， 设 

S(h ， k ， c ， z) = 

证明这个函数可借助于广义戴德金和数及锯齿函数以“封闭形式”计算。[提 示：当 z < k 时，对于 
0<_；< z ，量 b _ M 」- LG -2) M 」 等于1，且对于 z < j < k 它等于0,所以我们可以引进这个分数以 
及在 ( Xj < k 上的和。] 

► 19. [ M 23] 证 明：借 助于广义戴德金和数，通过求当 a ，/9， 〆 ， 〆 是给定整数且0<«</9<772, 

时，和 + ，的概 率的一个公式，可以在全周期上分析序列检 

验。[提示：考虑量1_(>3： - a )/ m」—L (z — 乡）/?72」。] 

20. [ M 29]( U . Dieter ) 借助于广义戴德金和数，求出>义,+ ^ >\ + 2 的概率公式，推广定 

理 P 。 



M. 



o^j< 


k 



第二组 


在许多情况下，对于整数的精确计算是十分困难的，但我们可以尝试研究当对： r 的所有实数 
值取平均，以代替把计算限制为整数值时出现的概率。尽管这些结果仅仅是近似的，但它们还是 
能展不出此课题的一点面貌。 


处理0和1之间的数 R 是方 便的； 而且对于线性同余序列 K 二 X „/ m ， 我们有 U n + l = 
UK + W ， 其中 6- dm 且 U 1 表示工 mod lo 例如，序列相关的公式现在变成 



► 21. [ HM 23 ]( R . R . Coveyou ) 在刚才给出的公式中， C 的值是多少？ 

► 22.[ M 22] 设 a 是一个整数，且0<0<1。如果工是0与1之间的一个实数，且如果 5(_ z ) = 

问 5( X )< X 的概率是多少？（这是定理 P 的“实数模拟”。） 

23.[28] 以前的习题给出了 a n + 1 < U n 的概率。假定是0与1之间的随机实数，问 


U n + 2 < U … CUn 的概率是多少？ 

24.[ M 29] 在上题的假设下，但卜0除外，证明 + + H 以 



的概率出现。假定是在0与1之间随机选择的，问在 L 7, 处开始的递减运行的平均长度是多 


少？ 

► 25. [ M 25] 设是实数，且 O < a <0< l ， O <，<，< l 。 在习题22的假设之下， 
«<工<0和，<4幻<，的概率是多少？（这是习题19的“实数”模拟。） 

26. [ M 21] 考虑一个“斐波那契”生成程序，其中 Lr „ + 1 = ! L ；„ + [7^,1。假定 R 和 L / 2 是在 

0与1之间独立地随机选择的。求 L 7,< L 7 2 < U 3 f Ui < U 3 < U 2 , U 2 < U { < U 2 等的概率。[提 

示：根据 x y y 和 |x + ： yl 的相对顺序，把单位正方形1 ( JC ，： y ) | O ^ o : ，: y<l I 分成六部分，并确定每个 
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部分的面积。] 

27. [ M 32] 在上题的斐波那契生成程序中，设除 Uoyu , 夕卜，和 R 是在单位正方形中独 

立选择的。试确定 h 是长度为々的上行运行的开头而使1/。>仏<〜< + 1 的概率。试 

把这同一个随机序列的相应概率作一比较。 

28. [ M 35] 根据式 3. 2丄3-(5)，效能为2的一个线性同余生成程序满足条件 X — - 2 X „ + 

X n + l = (a - l)c (modulo m ) 0 把这个式子抽象化为 U „ + l ^ \ a + 2 U n ~ _ ! 1，考虑这种情况下 

的生成程序。像在习题26中那样，把单位正方形分成对于每对 （ Ut ，％)， 表明[； 3 的 
相对顺序的诸部分。假定 [ A ， U 2 在单位正方形中随机地选择，是否有这样的 a 的值，对于它，所 

有六个可能的顺序都以+的概率被达到？ 

0 


3.3.4 谱检验 

这一小节我们将研究校验线性同余随机数生成程序质量的一个特别重要的方 
式。不仅所有好的生成程序都能通过这个检验，现在已知的所有坏的生成程序实际 
上都 不能通过它。 因此，到目前为止，它是已知最强有力的检验，值 得特 别注意。我 
们的讨论也将明确提出，由线性同余序列及其推广，能够预期的随机性程度的一些 
基本限制。 

谱检验体现了上边各节中所研究的经验检验和理论检验两者的一些方面。它 
像理论检验，因为它处理序列全周期的性质，同时，它也像经验检验，因为它需要一 
个计算机程序来判定结果。 

A . 检验的基本思想 最重要的随机性准则似乎依赖于序列的〖个相继的元素 
分布的一些性质，而谱检验直接地处理这个分布。如果我们有一个周期为 m 的序 
列，它的思想是分析 Z 维空间中所有^个点的集合 

丨 n < ml (1) 

为简便起见，我们将假定有一个(使得 c 关0的）极大周期长度为 m 的线性同余 

序列（乂0^^，7?2)，或者假定771为素数及 C = 0 且周期长度为 771-1。 在后一情况 

下，我们将把点（0,0,…， 0) 加到集合 （1) 中，使得总是总共有 m 个点； 当 m 很大时， 
这额外的点的影响可忽略，而且它使理论简单得多。在这些假定之下，集合 （1) 可重 

写做 

I 

•—(xys(x),s(s(jo)) y '-,s^ t ~ i Hx))\0^ : x< m ( 2 ) 

m 

其中 

s ( x ) = (ax + c ) mod m (3) 

是 i 的“后继”。我们仅仅考虑 Z 维中所有这样的点的集合，而不是这些点实际上被 
生成的顺序。但是生成的顺序被反映在向量分量之间的相关性上；而且谱检验通过 
处理所有点 (2) 的总体性来研究对各种维数 r 的这种相关性。 

例如，图8示出了对于具有 
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s ( x ) = (137 + 187 ) mod 256 (4) 

的生成程序，这是在二维和三维下的一个典型的小例子。当然，周期长度为256的 
一个生成程序几乎不可能是随机的，但256是很小的数，因而可以画出这个框图，以 
便在我们转到有实际意义的更大的772之前，首先做一些分析。 



⑻ ( b ) 

图8 

U ) 当 X „ + 1 = (137 X „ + 187) mod 256时，由所有相继的点偶 （ ， X ,, + ! ) 形成的二维的 栅格； 

( b ) 三元组（：^，乂, + 1 ，久„ + 2 )的三维栅格。 

或许，关于图 8( a ) 的方框模式最引人注目的事，是我们可以通过相当少量的平 
行线来全部覆盖 它们； 确实，有许多不同的平行线族，它们将碰上所有点。例如 ，一 
组20条近乎垂直的线就行，一组21条向上倾斜大约30。的线也行。当驾车经过已 
经播种的大片农田时，我们普遍地发现类似的情形。 

如果在三维中考虑同样的生成程序，我们就得到一个立方体中的256个点，它 
是通过如同在图 8( b ) 中所示那样，对图 8( a ) 中的平面的256个点（: r ， s ( i )) 都附加 
一 个“高”分量 sG ( x )) 得到的。想像这三维的晶体结构已经做成一个物理模型 ，一 
个我们可以在手上转动的立 方体； 当转动它时，我们注意到包含所有点的各种平行 
平面族。按 Wallace Givens 的话说，随机数“主要保持在平面内”。 

乍看起来我们可能想，这种系统的行为是如此的非随机，弄得同余生成程序十 
分没有价值了 ；但若更仔细地考虑，并注意到在实际使用中 m 是很大的，对它就能 
有更好地的洞察。图8中的正规结构实际上是当在高效能的显微镜下考察我们的 
随机数时看到的“颗粒”。如果我们真正地取0和1之间的随机数，并且舍人或截取 
它们成有限的精度，使得它们每一个都是1/〃的整数倍（其中 v 是给定的数），则当 
用一个显微镜观察时，我们得到的〖维点 （1) 将有极其规则的特征。 

设1“ 2 是遍历包含二维中的点丨（: c / m ， U )/ m ) 丨的所有平行直线族时，直线 
间的极大距离。我们将称^为随机数生成程序的二维 精度， 因为相继的数偶有一 
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个精良的结构，它大约能精确到分之一的程度。类似地，设 i / y 3 是遍历包括所有 

点 |(: c/m , s(x)l m ,s(s(x))l m) | 的所有平行平面族时，平面之间的极大距离；我们 
将称 M 为三维精度。〖维精度 v , 是遍历包括所有点 

U )/ m ) 丨的所有平行的 U -1) 维超平面族时，超平面间的极大距离的倒数。 

周期序列同已经截取成为1心的倍数的真正随机序列之间的实质性差别，在于 
真正随机序列的“精度”在所有维中都是相同的，而一个周期序列的“精度”却随着^ 
增加而减少。其实，由于当 m 是周期长度时在 Z 维立体中仅有 m 个点，我们不可能 
达到多于大约777^的 Z 维精度。 

当考虑 f 个相继值的独立性时，计算机生成的随机数的性能实质上就像将真正 
随机的数截取成 lg ^ 个二进位那样，其中^随/的增加而减少。在实践中，我们所 

需要的也就是这样变化的精度。我们并不一定要求10维精度为2 32 。也就是说，在 
一台32位字长机器上所有（2 32 ) 1() 个可能的10元组（％,卩„ + 1 ，…， L 7 7 , +9 ) 都将是同 

样可能的。对于这样大的 Z 值，我们仅仅要求（仏，％ + 1 ，…， R + h ) 的一些前导 
位具有独立随机的性质。 

另一方面，当实际应用中要求高分辨率的随机数序列时，简单的线性同余序列 
肯定不 适用； 应当使用具有更大周期的生成程序，尽管它实际上将仅仅生成这个周 
期的一小部分。把这个周期取平方实质上等于把更高维下的精度取平方，即，它将 
把精度的二进位有效数字加倍。 

谱检验是以小的 〆 比如说2<〖<6)的 W 值为基础的。为了发现在一个序列中 

重要的缺陷，维数2,3和4似乎是适当的，但由于我们正在考虑整个周期，明智的是 
稍微谨慎些并增加另一维或两维；另一方面，对 z >10 的^值，似乎无论如何都没 

有实际意义（这是幸运的，因为当 f >10 时计算^就显得相当困难了）。 

在谱检验和序列检验之间有一^个含糊的关系；例如，像在习题 3.3.3-19 中那样 
在整个周期上进行的序列检验的一个特殊情况，它计算图 8( a ) 中的64个方格中每 
个方格里边的小方格数。主要差别在于谱检验转动这些点以便发现最不合意的方 
向。在本节稍后，我们将回过头来考虑序列检验。 

乍一看，我们似应仅仅对于适当高的一个 z 值应用谱 检验； 如果一个生成程序 
通过三维中的检验，则似乎它也应通过二维检验。因此，我们倒不如省去后一个检 
验。在这个推理中出现了谬误，因为我们在较低维中应用了更严格的条件。对于序 
列检验也出现类似的情 况:考 虑这样一个生成程序，当单位立方体已经分成大小为 
1/4 x 1/4 x 1/4的64个小立方体时，它十分合适地在单位立方体的每个小立方体中 
(非常严格地)产生几乎相同的点数•，当单位正方形已被分成64个1/8 x 1/8的小正 
方形时，这同样的生成程序可能产生单位正方形的一些完全空的子正方形。由于我 
们增加了在较低维中的期望，故要求对每维进行分开的检验。 

不总是对的，尽管当诸点形成一个矩形栅格时这个上界是正确的。例 

如，在图8中，原来 y 2 = 因为接近六边形的结构使 m 个点比在一个 
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严格的矩形结构中更加靠在一起。 

为了建立有效的计算^的算法，我们必须更深人地考察相关的数学理论◦因 

此，建议不擅长数学的读者跳到本小节的 D 部分,在那里，谱检验是随着若干例子作 
为一个“插件”进行介绍的。但是，谱检验的数学背景仅仅要求某些初等向量运算。 

有些作者已经建议，使用平行覆盖直线或覆盖超平面的极 小数凡 作为准则，以 

代替它们之间的极大距离 llv t 。 然而这个数并不显得像上边定义的精确概念那样 

重要•，因为它受到直线或超平面的斜率和立方体的坐标轴相符到什么程度这一偏倚 
问题的影响。例如，按照下面的等式 （14) 以及 （ Wl ， w 2 ) = (18, -2),20 条覆盖图 

8( a ) 的所有点的近于垂直的线实际上有1//_的偏离，而这可能错误地蕴涵 

1//_的精度，也许甚至1/20的精度。而对于具有7/15的斜率的更大的21条直 

线族仅仅实现 1// M 的 精度； 有-11/13的斜率的另一个24条直线族，也有比20 

条直线族更大的直线间距离，因为1//_>1//_。直线族在单位超立方体的边 
界中起作用的确切方式似乎并非是一个特别“清楚”或重要的 准则； 然而喜欢计算超 
平面的人们，有可能用十分类似于我们计算4的方法来计算 N〆 见习题16)。 
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注意，增量 c 仅出现于 V G ， 而且的效果仅仅是移动 L 的所有元素，而不改 
变它们的相对 距离； 因此 c 无论如何 不影晌 谱裣验，而且当我们计算&时，也可假 
定 V Q = (0,0,…，0)。当为0向量时我们有一个所谓的点格 

Lo = I ：Vi K + ；y 2 V 2 + …+ 乂％ | 整数％ ，：y 2 ，…，％ I (10) 

而且我们的目标是研究在包括 L g 的所有点的平行超平面族中，相邻的 U - 1) 维超 
平面间的距离。 

平行的 U - 1) 维超平面的一个族可由垂直于它们的一个非0向量 [；= 
(W ，…， A) 来 定义； 而且在一个特殊超平面上的点 集是： 

\( x ^ y-' , x t ) \ x l u l + •■- + X t u t = q ) (11) 

其中 (7 是对于族中每个超平面都不一样的一个常数。换言之，每个超平面是使得点 
积 X. L； 有一给定值 g 的所有向量X的集合。在我们的情况下，超平面都以一个固 
定的距离分幵，而且它们之一含（0,0,…， 0); 因此我们可以调整 [； 的量度使得所有 

整数 (7 值的集合给出族中的所有超平面。然后相邻超平面间的距离是从 （0 ，()，..•， 
0) 到 q = l 的超平面的极小距离，即 

实数 1 T 4 I 十 … + 工? |工 1“1 + … + x t u t - 1 (12) 

柯西不等式(参考习4 1:2.3-30) 告诉我们 

(:+ …+ x t u t ) 2 ^ (工〒 + …+ + …+ W?) (13) 

因此当每个 A = u ; /(d+ …+ d) 时， （12) 中极小值 岀现； 邻近超平面之间的距离是 


1/+ …+ u 2 t = 1/ U 的长度 (14) 

换言之，我们寻求的量^恰是定义含有 L q 的所有元素的一个超平面族 U = q 
整数 d 的最短向量17的长度。 

这样一个向量 U == ( wi ，…， ) 必须非零，而且对于 L 。 中所有的 V 必定满足 
= 整数。特别是因为点（1，0，".，0)，（0,1，0，〜，0)，〜，（0,0，."，0，1)都在乙 0 


中，所有的 W 必为整数。其次，由于％在 Lo 中，我们必定有丄 （^ + <21^ + …+ 

m 

为整数，即 

ui + au 2 + *** + a L ~ x u t = 0 (modulo m ) (15) 

反之，任何满足 （15) 的非 0 整向量 17=(^ ，…，^)定义了具有所要求的性质的一个 
超平面族，因为 Lo 的所有点都将被 包括： 对于所有整数％，…，乂，点积 K +… 
十％%)•[；将是一个 整数。 我们已经证明 

2 ^ I | 

v t = min I z/i 十 ••• + Iz^ 十 + ••• 十 a u t = 0 (modulo m )= 

( Uy ， … ， IV, )¥(0 ， ■♦■ ， 0) 



min 

， ~ )#(o, … ， o) 


(( mx \ ― ax 2 


a 2 工 3 
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C . 推导一个计算方法 我们现在已经把谱检验的问题归结为求极小值 （16) 的 
问题，但是我们究竟怎样才能在不太长的时间内确定极小值呢？硬求是不行的，因 


为实际使用中 m 非常大。 

如果我们建立解一个甚至更为一般的问题的计算方法，它将是有趣的而且大概 
更有用：给定任何非奇异系数矩阵 U 二 （ Uij ) ，对所有非0整向量 （ JOi ，…，求 

/(A ， … ， X,) = UnA + …+ ““A ) 2 + …+ 十…十 U tl x t ) 2 (17) 

的极小值。 表达式 （17) 称做，个向量的一个“正定二次型”。因为 U 非奇异，因此 


除非&全为0,否则 （17) 不可能为0。 

把 L ； 的行写作 R ，…， L ；,， 则 （17) 可以写成 


/( 工 1，" 


X L ) = (: TiL/i + …十 OC t JJ t ) • (JCiL/! + …+ x L U t ) 


(18) 


即向量长度的平方。非奇异矩阵 L ； 有一个逆，它意味着我们可 


以惟一地确定向量 V ,，…， V ,，使得 


U 


V 


心， 


1 < i ,1 ^ 


例如，在谱检验中出现的特殊形式 （16) 中，我们有 


^ jT a 7 1 " " , 1~1 ■ —— _ 

u 1 = 

■ ^ 

( m 

u 2 = 

(- 

u 3 = 

(- 

U t = 

(- 


，0,0,…， 0) ， 


V ,= 


772 


( l ， a ， a 2 , …， a 


-i 


- a ,1，0,…， 0) ， 


a 


2 


, 0 , 1 , 


參蠡鲁 


，0)， 


v 2 

V 3 


( 0 , 1 , 0 , 

( 0 , 0 , 1 , 




■ 4 鼸 


, 0 ) 

, 0 ) 


a 


-1 


, 0 , 0 , 


參 ■馨 


，1) 


V , 


(0,0,0,4) 


(19) 


( 20 ) 


这些％恰是我们用来定义原来的格 L 。 的向量 （8) ，（9)。读者可能怀疑这是一个巧 
合——其实，如果以一个任意 的格“ 开始，它是由任意一组线性无关向量 Vi ，…， 
v t 定义的，则我们上边已经使用的论证可加以推广，以证明在一个覆盖族中，把超 
平面之间的距离极大化等价于把 （17) 极小化，这里系数 化由 （19) 定义（见习题2)。 

我们极小化 （18) 的头一步是把它归结为一个有穷问题，即证明，当求极小值时 

我们不需要检验无限多的向量卜：，…，心）。正是在这里，我们引入向量％，•••， 

■ 

V ,，我们有 


x k - + …十 x t iJ t ) • V k 


而且柯西不等式告诉我们 

((h R 十 …+ x L V t ) - V 々 ) 2 < /(a ，…， )( 

因此我们已经推导出关于每个坐标 A 的一个有用的 上界： 


引理 A 设 Ui ， …， x t ) 是极小化 （18) 的一个非0向量，并设 （ yi ，…， y t ) 是任何 
非0整向量，则 

工 i < /( M ，…， 30( K • V ；)， 对于 1 < 々 < Z (21) 

特别是，对所有 i 令 yi = 心， 


- < S 7 ♦ 




第 3 章随机数 


x 2 k < ( L 7, • U ; )( V , • VJ , 对于 I (22) 

引理 A 把问题归结为有限的查找，但是 （21) 右边通常太大了，使得不可能进行 
一个穷尽的 查找； 我们至少还需要另一个思想。在这样的时刻，一句老的格言提供 
了很好的忠告 ：“如 果你不能像问题所述的那样解决这个问题，就把它改成为有同样 
答案的较简单的问题。”例如，欧几里得算法有这个 形式； 如果我们不知道输入数的 
gcd ， 我们把它变成有同样 gcd 的较小数。（事实上，一个稍微更一般的方法大概是 

发现几乎所有算法的基础 ：“如 果你不能直接地解一个问题，就把它变成为一个或多 
个较简单的问题，由它们的解你可以解原来的问题。”） 

在我们的情况下，一个较简单的问题是要求较少查找的一个问题，因为 （22) 右 
边是较小的。我们将使用的关键思想是有可能把一个二次形改变成为对所有实用 
目的而言和它等价的另一个二次形。设 7 是任何固定的下标，，…， 

+ i ，… ，仏）是〖-1个整数的任何 序列； 并考虑下列向量的 变换： 

= v t - QiVj ，= Xj _ q , x 3 , U \ = L 7 2 .，对于 i ^ 

~ x ) ^ x j ^ = Uj + ^ (23) 

容易看出，新的向量 u 、 ，…， ir t 定义一个二次型/，它有/ u ;, X ；)= 

/(々，…， xj ; 其次，基本正交条件保持 （19) 成立，因为容易校验 iTrV ^ d 。。 由于 
(^，…，^)跑遍所有非零整向量，所以 （ x 〗 ，…， X :) 也是； 因此新的形式/有和/ 一 
样的极小值。 

我们的目标是使用变换(23)，而且对于所有的以 [7: 代替 K ， 以 V ;代替％， 
以便使 (22) 右边成为 小值； 而且当17, L 7 ; 和 V r V k 都小时， （22) 右边也小。因此， 
关于变换 （23) 自然要问下列两个 问题： 

a ) 选什么样的^能使尽可能小? 

b ) 选什么祥的 w ，•••，％ —丄 ，幻 + 1 ，…， 仏能使 [7; 尽可能小？ 

首先，对％的实数值解决这些问题是最容易的。问题 a ) 十分简单，因为 

( V, _ - q-y^ = V ; • V 2 - 2 Ql V t • V ; + q 2 i V j • V ; = 

(V ； _ Vj )( q , - ( V ?: • V J / V J - V ; )) 2 + 

V, - V, - ( V 2 - • V ] ) 2 iV ] • V ; 

而且当 

t = V ， • Vj / Vj - Vj (24) 

时出现极小值。从几何上看，我们问的是应从 V , 减去％的多少倍，使得得到的向 
量 V ;:有极小长度，而答案是，选择％使得 V ;垂直于 K (即使得 V ;. 1 = 0); 下面 
的 （25) 使这个问题一目了然。 

转到问题 b )， 我们要选择％使得 K + R 有极小的 长度； 从几何上说，我 

们要从 R 开始，并且把某个向量加到它的点是丨 a 的倍数之和的0 - 1) 维 

超平面中。再次，最好的解是选择使得 17] 垂直于超平面的那些东西，使得对于所 

• 88 • 


3.3 统计检验 




有 k 内， u ? u k =ih 

Uj • u k 十 • U k ) = 0, 1<々< “ k ^ J (26) 

I j 

[关于问题 b ) 的一个解必 Jr 满足这些/ - i 个方程的严格证明请见习题12。] 

既然我们已经回答了问题 a ) 和 b ), 我们就有点左右为难了 ；我们是应该按 （24) 
来选择仏，使得 V ； • V ；.极小呢，还是应该按（26)，使得 U ] - U ] 变极小？这两个选 

择的任何一个都对 (22) 的右边做了改进，因而并不能立即明了哪一个应获优先。幸 
而，对于此两难处境有一个非常简单的答案：条件 （24) 和 （26) 完全相同（请见习题 
7)，因此问题 a ) 和 b ) 有相同 答案； 我们很高兴，可以同时减少 U 和 V 的长度。确 

实，我们刚刚重新发现了 Gi ■腿 -Schmidt 正交过程[见 & e〗le 94 (1883) ，41 〜73 ] 。 

认识到我们仅仅对于％的实数值处理了问题 a ) 和 b )， 我们的高兴心情就要受 
到节制。我们的应用把我们限制于整数值，所以不能使 V ;精确地垂直于对于 
问题 a ) 我们所能做的最好的事是令％是最 接近于 V r V J IV r V J 的整数（请见 
(25))。结果是这并非总是对于问题 b ) 的最好 的解； 事实上， W 有时可能长于 K 。 
然而，界 (21) 绝不增加，因为我们能够记得迄今找到的/(力，…， M ) 的最小的值。因 

此单独基于问题 a ) 对仏 的一个选择是十分令人满意的。 

如果我们以这样一种方式，即向量 V ,没有一个变得更长，而且至少有一个要变 

短些，重复应用变换(23)，那么就绝不会陷入一个循环中去；即是，在进行了这种类 
型的一系列非平凡的变换之后，我们将不会再考虑相同的二次型了。但是实际上我 
们总会被搁浅的，因为对于 1< j <“（23) 的变换将不能缩短向量 V ,,--, V ,中的任 

何一个。这时，利用引理 A 的界——在大多数情况下它是十分小的——我们可以逆 
转到一个穷尽查找上。有时这些界 (21) 将是很差的，而另一类型的变换通常将使算 
法再次开动并把界减少（见习题 18) o 然而，变换 （23) 本身已经证明，当如同下面讨 

论的算法那样安排计算时，它是令人惊讶地强有力的。 

如何实施谱检验 现在由我们的讨论得出一个有效的计算过程。 
R . W . Gosper 和 U . Dieter 已经发现，有可能使用较低维数的结果来使谱检验在更高 
维中运行得快得多。这个改进已连同高斯对二维情况的重大简化被加入到下列算 
法中（请见习题5)。 


算法 S (谱 检验） 对于2<纟<7\给定 a , m 和： T ， 其中 0< a < m 且 a 与 m 互 
素，这个算法确定 
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x 


t 


X 


+ ax 2 + *** + a l ~ { x t 三 0 (modulo m 


(27) 


的值。（极小是对于所有非零整向量，…， x ,) 来选取的，而且数 h 如同在上面的 

正文中所讨论的那样，测量随机数生成程序的/维精度。）本算法所进行的所有算术 
运算都是对于其量级很少（如果有的话)超过 m 2 的整数进行的，步骤 S 7 除外； 事实 
上，在计算期间几乎所有整数变量的绝对值将小于 m 。 

当对于计算 v , 时，这个算法对两个 z x 〖的矩阵 L 7 和 V 有效，对于1< 

它们的行向量以 R ，…，& ) 和 V ,二 （ ，…，表示，这些向量满足下 

列 条件： 

Un + aw 。 + …+ a 卜 1 u it = 0 (modulo m ), 1 ^ ^ ^ (28) 


U , • Vj 二 mS ” 1< i (29) 

(因此，我们以前讨论的％已被乘以 m , 以确保它们的分量是整数。）有三个其它的 
辅助向量 X =( xi ，***, x / ), Y = (% ，…，: v ,) 以及 Z = (q ，…， ％)。在整个算法期 
间， r 将表不 V 1 mod m , 5将表亦迄今已经发现的 v 〗 的最小上界。 

5 1. [初始化]置 t ^~2 ， h — a ， h ’ — m ， p —1 ， 0 ， r — a ， 5 —1 十 a 2 (这个算法 
的头一步通过一个特殊的方法处理 Z =2 的情况。这个方法非常像欧几里 

得算法，在计算阶段将有 

h - ap 三 h / - ap ’ 三 Q (modolo m ) 和 hp ' - h'p = ± m 、 (30) 

52. [ 欧几里得步骤]置 q — \_h/1 h j ， u—h/ _ qh ， v — p’ _ qp 。如果 u 2 + v 2 < 
s ， 置 s^~u 2 + v 2 yh^—h ,h^~u , p ^p ^ p^~v 并重复步骤 S2 0 

S 3 •[计算 4] 置 u^~u _ h ， v — v _ p ; 而且如果 u 2 十 v 2 〈 s 则置 — w 2 + t / 2 , 


h ^ U ^ P ^ Vo 然后输出心 = y 2 。 （对于二维的情况这个计算的正确性在 

习题5中证明。现在我们将建立满足 (28) 和 （29) 的 L ； 和 V 矩阵，为更高维 
的计算做准备。）置 


U 




- h 


P \ 


-W p 


V 


土 


P 


P 


h / 
— h 


其中，当且仅当 /〉 o 时用负号。 


S4 




: T ， 算法结束。（否则我们要对〖加1，这时 L ； 和 V 是满 
足 (28) 和 （29) 的 t 乂 t 矩阵，因而我们必须通过加上一个适当的新行和新列 


来扩大它们。）置 t — t 十1和厂 




ar 


)mod 


m 


置 u t 为 


个元素的新行 


(- r ，0,0, …，0，1)，且对于 l <2< t 置… — 0。 置％ 成为新行（0,0,0, 


馨 ■ ■ 


0 ， m) 

U , 


o 


最后，对于 < t ，置 round ( v n r/m ) y v lt 


U 



qU 


(这里 “round ( 


—Vu r _ qm y HL R 

表示最接近于 X 的整数，例如 Lx + 1/2」。 


我们实质上置并且对于 J 二 
大，因此它们应立即被减小。）最后置 
(在下列步骤中， 7 表示变换 （23) 的当前行下标 j 表示最后的这样的下标， 


S 


立即应用变换（23)，因为数 |% r | 太 
^min( 5 , U t • U t ) ， k — t 


lo 
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即其中变换至少缩短％之一。） 

S 5 .[变换]对于进行下列运算 ：如果 和2| VV V ,| > V ， V 」，置 

q ^- ioundiVrVjIVj - V ,)， V ; -^ V y - qV ” U 广 U ) + qU lf s ^ mm ( s y 

U ,)， 以及 k— Jc (当2|\^%|精确地等于 - V ; 时，我们省略这一 变换； 

习题19证明这个预防措施防止算法无穷地循环。） 

S 6 •[推进 j ] 如果 = Z ，则置7 — 1;否则置 J J 十1。现在如果_；#々，则返回 
步骤 S 5。 （如果 y = l 我们已经通过了无变换的 i -1 个连续的循环，因此 

变换过程搁浅。） 

S 7 .[为查找做准备](现在使用对满足引理 A 的条件 （21) 的所有（:^，…，^) 
的穷尽查找，将确定出绝对极小。）置 X — (0,…，0)，置 A — “并置 

Z , —L VL ( % • \^)5"72 2 」」， 其中 (31) 

(对于我们将考察 I 巧|<~的所有( X 〗，…，心）。通常 

I 3 I < 1，但 L . C . KiUingbeck 在1999年注意到当 m = 2 64 时，所有乘数的大约 

0.00001 会出现大的值。在穷尽查找期间，向量 Y 将总是等于+…+ 

x t U t 使得 /(A y -' y x L )= y * Yo 由于 /( - h ，…， _ :rj = /( A ，…， A ) ，因 

此我们将仅仅考察其头一个非零分量为正的那些向量。这实质上是在如下 
算法各步骤中的计数方法 ：它把 Ui ，…， A ) 当做在具有混合进制 （2 z 】 十1,…， 

十 1) 的平衡计数系统中的数字 处理; 请见 4.1 节。） 

S 8 •[推进 A ] 如果々 = 则转到 siOo 否则 々加 1并置 y — y + 仏。 

S 9 •[推进々]置6十1。然后如果 Kz ， 则置 - 々， Y — Y -2々 U 々并 

重复步骤 S 9。 但如果々> Z ，则置 5^ min ( 5 , Y • Y ) o 

S 10 •[减少々]置 k — k - u 如果々>1，则返回 S 8。 否则输出4=心（穷尽查 

找完成）并返回 S 4。 I 

实践中 ，一 般对了 = 5或6应用算法 S ; 当了 = 7或8时，它通常工作得相当好， 
但当了>9时它可能非常慢，因为穷尽查找趋于使运行时间随3 7 '而增长。（如果在 
许多不同的点出现极小值 〜则穷 尽查找将把它们全部找出；因此我们通常发现，对 

于很大的 i ， 典型地都有％ = 1。如上所述，当〖很大时，^的值一般不适合于实用 
目的 。) 

一个例子将有助于弄清算法 S ， 考虑由 

m = 10 10 ， a = 3141592621, c = 1, X 0 = 0 (32) 

定义的线性同余序列，步骤 S 2 和 S 3 中的欧几里得算法的六个循环足以证明满足 

工】+ 3141592621 x 2 = 0 (modulo 10 10 ) 

的 + d 的极小非零值当 x 1 = 67654, o ： 2 = 226 时 出现； 因此这个生成程序的二维 
精度是 

y 2 = V 67654 2 + 226 2 ^ 67654.37748 
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对于三维，我们求使得 

: c ! + 3141592621 x 2 + 3141592621 2 ^ 3 = 0 (modulo 10 10 ) (33) 


的极小非零值 4 + x 〗 + x 2 3 。 步骤 S 4 建立矩阵 


- 67654 - 226 0 

U = - 44190611 191 0 V = 

5793866 33 1. 


-191 - 44190611 2564918569 

- 226 67654 1307181134 

0 0 10000000000 


当 i =2 时以^ = 1，当 i = 3 时以^=4,来进行步骤 S 5 的头一次迭代，把它们改变成 
为 



- 21082801 

97 

4、 


-191 

- 44190611 

2564918569、 

U ~ 

- 44190611 

191 

0 

V = 

— 35 

44258265 

- 1257737435 


、 5793866 

33 

l ] 


、 764 

176762444 

- 259674276 J 


(注意头一行在这一变换中实际上已变得更长了，尽管最终 U 的诸行将缩短。） 

步骤 S 5 的以下 14次迭代有（ ； ， 91 ，(? 2 ^ 3 ) = (2, -2, * ，0)，（3,0,3, 0,(1， 


* ， _ 10，-1),(2, - 1， * ，-6),(3, -1,0, * ),(1, * ,0,2) , (2,0, * , ~ 1) , (3,3, 
4,* ),(1 ,0, 0),(2, -5, * ,0),(3, 1,0, * ),(1, ^ , - 3, -1),(2, 0, * ,0),(3, 

0,0, * )。现在变换过程搁浅了，但矩阵的诸行已经变得相当 短了： 



’ -1479 

616 

- 2777, 


- 888874 

601246 

- 2994234^ 

U 二 

- 3022 

104 

918 

V = 

- 2809871 

438109 

1593689 


、- 227 

- 983 

-130, 


、- 854296 

- 9749816 

-1707736, 


(34) 


步骤 S 7 中的查找极限 （^3 2 ,2 3 ) 结果是（0,0,1),所以 U 3 是 （33) 的最短的解，我 


们有 


M = 7227 2 + 983 2 + 130 2 ^ 1017.21089。 

为求这个值仅仅需要少数迭代，尽管乍一看条件 （33) 十分难以处理。我们的计算已 
经证明由随机数生成程序 （32) 产生的所有点 （ L 7 W ， U n + 1 ， L 4 +2 ) 位于相隔大约 

0.001 单位的平行平面族上，但不会全落在平面之间相隔超过 0.001 单位的平面族 
上。 

步骤 S 8 〜 S 10 中的穷尽查找仅仅很稀少地减少 S 的值，一个这样的情况是由 
R . Carling 和 K • Levine 在 1982年发现的，当 a = 464680339 ， m = 2 29 和 r = 5时它出 

现； 另一个情况是当作者对本小节稍后表1的行21计算 v 2 6 时出现的。 


E . 确定各种生成程序的等级 迄今我们实际上还未给出一个准则，来指出一 
个特殊的随机数生成程序是否“通过”或者“通不过”谱检验。事实上，谱检验的成功 
取决于应用，因为某些应用要求比其它应用有更高的分辨率。对于大多数应用来 
说，对于将是十分适当的（尽管作者必须承认选定这个准则部分 

地是因为30可方便地为2,3,5和6所整除）。 

对于某些目的而言，我们将喜欢相对地独立于 m 的准则，所以我们可以说对于 
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"5 = ^5^"6 = 

我们可以说对于如果 & 是 0.1 或更多，则乘数 a 通过谱检验，而且对于所 

有这些“如果&>1，则它“出色地通过”。&的低值意味着我们大概已经挑上了一 

个非常倒霉的乘数，因为很少的格会有如此接近原点的整数点。反过来，&的高值 

意味着我们对于给定的 m ， 已经找到异常好的乘数 ； 但它并不表明随机数必然非常 
好，因为 w 可能太小。只有&的值才真正地指出随机性的程度。 

表1表明在典型的序列中出现的值的类型。这个表的每行考虑一个具体的生 
成程序，并且列出 v 2 t ^ t 以及“精确度的二进位数” lgv ,。 行1到行4示出 3.3.1 小 

节中图2和图5中提到的生成程序。行1和2的生成程序由于乘数太小而质量不 
佳; 像图8那样的图形当 a 很小时有几乎垂直的“条纹 "。行 3上的糟糕的生成程序 

有好的"2,但 M 和 AM 却很差；和几乎所有效能为2的生成程序 一 样，它有 W 
和~ = 2(见习题3)。行4给出一个“随机的” 乘数； 这个生成程序已经令人满意地 
通过大量的关于随机性的经验检验，但它没有特别高的^，…， m 值。事实上， 
的值通不过我们的准则。 

行5给出图8的生成程序。当考虑^直到~时，它出色地通过谱检验，当然 

m 太小了，因此这些数几乎不能叫做随机数的值低得不像话。 

行6是上边 （32) 中讨论的生成 程序； 行7是类似的例子，并且有一个异常低的 
值。_行8给出对于同一个模数 m 的一个非随机的 乘数; 所有它的部分商都是1， 

2或3。这些乘数是由 I . Borosh 和 H . Niedenreiter 建议的，因为戴德金和数可能特别 
小，而且因为它们在二维序列检验中产生最好的结桌（参考 3.3.3 小节和习题30)。 
行8中的具体例子仅有一个“3”作为一个部 分商； 没有这样的乘数，它模20同余于 
U 而且它关于 10 1 G 的部分商仅由一些1和2组成。行9的生成程序给出恶意预谋 
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3 * 3 统计检验 


选定的另一个乘数，这是 A . G . Waterman 建议的，它保证相当 高的； 值（见习题 
11)。行10是有趣的，因为 尽管； 非常低 ，但; 却很高（参见习题8)。 

表1的行11是对过去的好时光的提醒——自 O . Taussky 于20世纪50年代初 
提议以来，它曾经被广泛地使用过。但在60年代末，2 35 是一个合适的模数的那些计 
算机开始淡出，而且随着32位算术运算的机器开始激增，到80年代它们几乎完全 
绝迹了。这种朝着相对小的字长的改变要求相对更大的小心。天啊，行12的生成 
程序实际上已经被世界上大多数科学计算中心这样的机器使用了 10年 以上； 它奇 
特的名字 RANDU 足以使许多计算机科学家大跌眼镜和大倒胃口！实际的生成程序 
是由 

奇， X w + 1 = (65539 XJ mod 2 31 (37) 

定义的，而习题20指出，2 29 是对于谱检验的适当模数。由于 9 X „ - 6 X „ + 1 十 X m+2 = 

0 (modulo 2 31 )，因此这个生成程序不能通过随机性的大多数三维准则，因此它本不 
应被使用。几乎任何同余于 5( 模 8) 的乘数都会要更好些。 （ R . W . Gosper 注意到关 

于 RANDU 的一个奇怪的事实，即 y 4 = y 8 = ^9 = / II 6 ，因此是人注目 

的 11.98。）行 13和行 14是对于模2 32 的 BoroshrNiederreiter 和 Waterman 乘数。行 
16和23是 M . Lavaux 和 F . Janssens 在计算机查找中发现的，他们的目的是查找具 
有很高的值且谱检验很好的 乘数; 行22在 Cray X - MP 库中与 c = 0 和 m 二2 48 — 

起作为乘数 使用； 行 26( 它的杰出的乘数6364136223846793005太大了，在一栏中装 

不下）是由 C • E • Haynes 给出的。行15是由 George Marsaglia 在进行了二维到五维 

的接近立方的格的计算机查找之后，作为“所有乘数中最好者的候选者”而提出的， 

部分原因是它便于 记忆。 [Applications of Number Theory to Numerical Analysis , 
S . K . Zaremba 编 （New York ： Academic Press , 1972) ,275] 0 

行 17 使用一个随机原根，对素数 2 31 - 1 的模作为乘数。行18示出对于 2 31 - 1 
谱上最好的原根，它是由 G . S . Fishman 和 L . R . Moore III 通过穷尽查找发现的 
[SIAM J . Sci . Stat . Comput . 7 (1986),24 — 45]。 在行 19 中的适当的但不太突出的 
乘数 16807 == 7 5 ， 在由 Lewis , Goodman 和 Miller 于 IBM Systems J . 8 (1969) ， 136 〜 
146 上提出之后，实际上最经常地用于此 模数； 自1971年以来它已经成为流行的 
IMSL 子程序库中主要的生成程序之一 。 a = 16807之所以被继续使用是因为 a 2 小 
于模数772 , 因此 mod 772可以使用习题 3.2.1.1-9 的技术以相当高的效率在高级 
语言中实现。然而这样小的乘数有已知的一些缺点。 S . K . Park 和 K . W . Miller 注 

意到同样的实现技术也可应用到大于^的某些乘数上。所以他们要求 
G . S . Fishman 在这更宽的表中找到最好的“可有效移植的” 乘数； 结果出现于行20 
上 [CACM 31(1988),1192 〜1201]。行21示出由 P . L ’ Ecuyer 给出的另一个好的乘 
数 [CACM 31(1988) ，742 〜 749, 774] ;它使用稍微更小的素模数。 

当如同在等式 3.2.2-(15) 中建议的那样，通过减法把行20和行21的生成程序 
组合在一起，使得被生成的数满足 
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X „ + 1 = 48271 X „ mod (2 31 - 1)， 八 + 1 = 40692 Y „ mod (2 31 - 249) 

, 、 ， v 、 (38) 

= ( X , - yj mod (2 31 - 1) 

时，习题 32 证明，用对于 m = (2 31 - 1)(2 31 -249) 和 a 二 1431853894371298687的谱 
检验来对〈4〉评级是合理的。 U 的这个值满足 a mod (2 31 - 1) = 48271和 a mod 

(2 31 -249) =40 692。）结果见于行24上。对于低 的；^ 的值我们不必太担心，因为 

v 5 >1000 o 生成程序 （38) 有长度（2 31 -2)(2 31 -250)/62 & 7 X 10 16 的周期。 

表的行25表不序列 

X n 二 (271828183 X „_ 1 - 314159269 X ^2) mod (2 31 - 1) (39) 

可以证明它有（2 31 -1) 2 -1的周期 长度； 它已通过习题24的广义谱检验做了分析。 

表1的最后三行是基于带进位加法和带借位减法得 出的； 它们模拟有极其大的 
模数的线性同余序列（见习题3.2.1.1-14)。行27是对于生成程序 

X „ = ( X n -i + 65430 X „_2 + C „) mod 2 31 

C „ + 1 = L ( X rj _ 1 + 65430 X ^ 2 + CJ /2 31 J 

的，它对应于 ^ + i = (65430*2 31 + 1)^ mod (65430• 2 62 + 2 31 - 1 ) ;表中的这些数称 

做“超值” 

Xn = (65430 - 2 31 + l ) X n ^ + 65430 X „_ 2 + C n 
而不是真正被计算和被使用作随机数的值。行28表示更典型的带借位减法的 


生成程序 

X n = (X n -iQ — X n _24 — C n ) mod 2 24 , C ” + 1 = [ X ”，< X n _ 2 4 + C „ ] 

但通过生成序列的 389 个元素并且仅仅使用开头（或最后的 ）24 个做了修改。这个 
生成程序，在通过了以前的生成程序没有通过的许多严厉的检验之后，被 Martin 
Liischer 所推荐 ，并 取名为 RAN LUX [Computer Physics Communications 79 (1994), 

100 〜 110]。 一 个类似的序列 

- ( X ,_ 22 - X ,_ 43 - CJ mod (2 32 - 5), C n + 1 = [ X „_ 22 < X n _ 43 + Cj 

岀现在行 29 上，而且在生成 400 个之后只使用 43 个 元素； 在习题 3.2.1.2-22 的答 
案中对这个序列做了讨论。在两种情况下表的各项都称为对多精度数 h ， 而不是 

对个别“数 字”尤 的谱检验，但是高的^值指出，在选择 24 个或 43 个之前生成 389 


个或400个数的过程是去掉由于生成方案的极端简单性所引起偏倚的杰出方法。 

对于&的理论上限在表1的紧底下示出，对于任何的 m 它们都不能被超越。 

已知每个单位体积中有 m 个点的每个格有 

^ < y ] l 2 m llt (40) 


其中 h 对于〖=2,…，8,分别取 

( 4/3 ) 1/2 ，2 1/3 ，2 1/2 ，2 3/5 ， （ 64/3 ) 1/6 ，4 3/7 ，2 (41) 

的值。[见习题 9 和 J . W . S . Cassels , Introduction to the Geometry of Numbers 
( Berlin : Springer ， 1959 )， 332; J . H . Conway 和 N . J . A . Sloane , Sphere Packings, Lat¬ 
tices and Groups (New York : Springer ， 1988) ,20。 ] 这些界对于由任何实坐标向量生 
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成的格均成立。例如，对于 


2的最优格是六面体的，而它是由形成一个等腰三角 


形的两边且长为的向量生成的。在三维中最优的格是由可被转动成形式 


( P ， P ，_!；)，（!；， - H ),(- p ， U ) 的向量 生成的，其中 


1/ \! 4m 0 


W F . 同序列检验的关系 


在自20世纪70年代以来发表的一系列重要文章中， 


Harald Niederreiter 已经说明如何借助指数和来分析 


维向量 （1) 的分布。他的理论 


的一个主要推论是若干维中的序列检验将为通过谱检验的任何生成程序所通过，甚 
至当我们仅考虑周期的充分大的一部分而不是全部周期时也是如此。我们现在将 
转而简单地研究一下，在周期长度为 m 的线性同余序列 （ X Q ， a ， e ， m ) 的情况下，他 

的有趣的方法。 


我们需要的头一个思想是在 


维中 的差异 的思想，我们将它定义为落入到 


个 


超矩形区域的 


维向量，〜 


• 的预期数和实际数之间的差别（对所 


有这样的区域取极大）。精确地说，设 〈 x „〉 是在范围中的一个整数序列， 
我们定义 


D 


(0 



max 

R 


0 < n < N 时尺中的 （A 


的个数 


R 的体积 


N 


m 


t 


(42) 


其中尺取遍形式为 


R 


(: yi ，■• 


^ 3^1 < A 


a 




Al 


(43) 


的所有点的集合，这里~和爲是对于1 < ) <〖，在 (X 0^〈爲< m 的范围中的所有 
整数。 R 的体积显然是 （&-&)•••(/?, -七）。为得到差异我们想像考察所有 
这些集合只并且从中求出对点集 （^，…， a + 来说超量或缺额为最大的一个集 
合。 


通过使用指数和可以找到差异的一个上界，令 o > 


e 


是一/卜 m 次本原单位 


根。如果（:，…， A ) 和（: 
范围中，我们有 


■ 

y 


• • 


，:^)是两个向量，它们的所有分量都在 0<: r , ，％< m 


S 


CO 


)u 


■ 疇 ■ 


+( 


m 


若 （ 工 i ，…， x J 


，…，: vJ 


i 


0<!i •■ w < 


0 


若（: ri ，•■•，々）# (: yi ，… , y t ) 


因此当只由 （43) 定义时，对于 0</ z < N ，尺中向量（工 „，…， A + 的个数可表达 
为 




1； 


CO 


JC ^ J H - 


1 


' 2 


0 ^ n <i N 0 ^ u 4 , u < 


t 


< 


2 , 




在这个和中当 ^ 
d 1; } 表达为 


u 


0 时，我们得到 Nim 1 乘以及的 体积； 因此我们可以把 


N?n 


7 2 




X « ■ + …+ JT 

O ) 〃 1 




2 


0) 




0 ^ n < N 0 ^ « 




(w, ,“ ） #(0,… ， 0) 




在尺 上的极大值。由于复数满足 k + zigla ; 



Z 


I 和 I ⑴ 


Z 


CO 


UI ，由此得出 
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^max 


R 


m 


t 


0^ u ^，… < m 

，…， 〜 ）#( 0 , …， o ) 



2 


CD 


一 （A ) 




Q r < y t < ^t 


g( 


U\ 


u 


)< 


1 


m 


t 



O^u 


u 


^ < m 

• tO #(0, ■■■，0) 


max 

R 




(JO 


一 （ jy，w + … + y w ) 


Q t ^ y i < ^ 


g(u 


u 



f(w“ ， u t 、 g(Uh …， u t ) 


(44) 


(X U ^ y iW ' y 17t 

(«「■■■，ii )#(0, … ， 0) 


其中 


g(u 


U t ) 


N 


2 


X U f +- 1-JC 

Ot) ^ 1 n 


1 


u 


0^ n<N 


y 


， ） 


max 

R 


m 


t 





CO 


一 （: y , u t + -■- +v w 




a ^ y t < ^ 


max 

R 


m 


2 


co 




m 



co 


V , 




为了得到关于的好上界， / 和 g 两者都可进一步简化。当时我们有 


m 



co 


uy 


a ^： y < (3 


CD 


爲 u 


CD 


au 


m 


co 


u - 1 




2 


1 


m 


co 


w - 1 I 


msininu/m ) 


而且当 u =0 时这个和小于等于 1; 因此 


/( 以1，…， 


U 


) ^： r(u x ， … ， u t ) 


(45) 


其中 



u 


1，…， A ) 


n 

u ^ k^t 


1 


msin(7tu k l m) 


而且当 〈 zj 是由一个线性同余序列模 m 生成时，我们有 

工 #1 +…+ 工《 + 卜 1 A = x n u l J t{ax n + c)u 2 +'- J r(a t ~ l x n + c (a’— 2 +…+ 1 ) ) % = 

( ui ^ au2 ^ tm 9 ^ a L ~ l u t ) x n +h ( ，…， 〜) 

其中 6(1^ ，…， wj 与 7 Z 无关；因此 


(46) 


其中 


g( 



N 



CO 


q ( u 


^ U t )X n 


0^ rj<N 


(47) 


广、 u t ) - u x + au 2 + *•• + cl~ x u t (48) 

于是这里引出了和谱检验的关系 ：我们 将证明，和数 g ( Wl ，…，^)是相当小的， 

除非 gOi ， …， w ,) 三0 (modulo m ); 换句话说，对 (44) 的贡献主要来自于 （15) 的解。 

其次，习题27表明，当 （ wi ，…， ) 是 （15) 的“很大的”解时 ， r ( wi ，…， ） 是相当小 

的。因此，当 （15) 仅有“很大的”解时，即当通过谱检验时，差异将是相当小的。 

我们剩下的任务是通过进行仔细的计算来对这些定性论述进行定量。 

首先让我们考虑…，^)的大小。 当 N = m 时，即 （47) 是对整个周期求 

和时，除了当（〜，…，〜）满足 （15) 外，我们有，…，^) = 0,所以在这种情况下 
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通过遍取 （15) 的所有非 0 解对 r ( ，…，^)求和，就得到差异的一个上界。但我们 
也考虑当 iV 小于772和，… ， w f ) 不是 m 的 一 个倍数时，在像 （47) 这样的一个和 


数中会发生什么情况，我们有 


N 


I ： 


( x) X ^ 


0< n<N 


N 0^N m ^m 


nk 


}k 


0<j< 


N 


I ： 

Q ^ k < 


m 




CO 


nk 


S 


kO 


(49) 


0< n < N 


其中 


S 


I ： 


CO 




(50) 


0<J< 


现在 s 


CO 


- Ik 


Sm ， 所以对所有 Z，|S 


s 


々0 


，而且我们能通过进一步的指数对称 


性来计算这个共同 的值: 


S 


kO 


m 




s 


kl 


0^/< 


m 






CO 






CO 


X. 


ik 


0 </< 


0<j< 


0</< 


m 


m 


2 ⑴、广 以 
O^i ,j K m 

S … 2: 

0^ i < m i ^ j < m + i 


2 


0) 


X. 


0 </< 


z 


(j-l)k 


2 


0) 


(a 广 ， - 1) 


z • 


+ ( 厂 -l 〉 c/u-l) 


0^ l < 


设 S 是使得 Y = modulo 772) 的极小值，且设 


s ’ = ( a s — 1) cl (a ~ 1) mod 


m 


则 s 是 m 的一个因子(请见引理 3.2.1.2 P )， 且 & 


+ js 







js ' (modulo m ) o 除非 


:是 s 的一个倍数，否则对 Z 的求和等于0,所以我们求得 


S 


kO 


m 


2 


(X j < ml 


我们有/ 


心，其中 q 与 m 互素（参考习题 3.2.1. 2~21 ) ，所以结果是 


S 


kO 


m 


0 

/ ^~S 


若是十 q " ^ 0 (modulo 


m 


若 k 



Q 


0 (modulo mis 


(51) 


把这信息放回 （49) 中，并回想起 (45) 的推导，即得 


N 


2 


0) 


< 


771 


0^ n<N 


N^s 


^ r ( k ) 


(52) 


其中求和是对使得 


0 (modulo 7 ? 2 的0< m 进行的。现在习题25可用 


来估计剩下的和数，我们求得 


N 


I ： 


0<n< N 


< — ^flns + 0(Jp 

f 沉 N \Nis 


(53) 


同样的界可用来估计对任意 (? 吴 ( Kmodulom ) 的 TV 


"I 


，因为其效果只 


是在这个推导中以 77 Z 的一个因子代替 m 。 事实上，当9和 m 有公因子时，上界甚 


至更小，因为 


和 


m 


i^Ts 


般地变得更小（见习题26)。 
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我们现在已经证明如果 N 足够大且如果 （ Wl ，…，〜）不满足谱检验同余（15)， 

则差异的上限 (44) 的 g ( 心，…，〜）部分很小。习题27证明，当对所有满足 （15) 的 

非零向量“，…，⑷）求和时，假定所有这样的向量都离（0,…， 0) 很远，则我们的上界 

的 ， A ) 部分很小。把这些结果归并在一起，就得到下面的 Niederreiter 的 
定理： 


定理 N 设 （ X „ ) 是周期长度为 m 的一个线性同余序列 ( X 0 ， a ， c ， m ) JH^ s S 
使得 V 三 l(modulo m ) 的最小正整数，则如同在 (42) 中所定义的那样，对应于 （ X n ) 
的头 N 个值的 t 维差异 D ⑷ ，满足 

n (0 _ ^ (心 log s (log m V ) 丄 ^ / m (log m ) 1 \ ^//, ^ 

- N ~~ I °\ Nis J + 0 ((log 饥)厂 _) (54) 

DL ’）= 0 ((log m ) V max ) (55) 

这里 在 (46) 中定义的量 r ( u '， …， u t )的极大值，是对满足 (15) 的所有非 Q 整向 
量 （ ，…， u t ) 得到的。 

证明 （54) 中的头两个 O 项来自 （44) 中不满足 （15) 的向量（心，…，〜），因为 
习题25 证明对 于所有 （ Wl ，…，％)求和之 /( iM ，…，…）是 0(((2/7 r)ln m V ),而且 
习题26给出每个，…，^)的界。（这些项在 （55) 中见不到，因为在该情况下 
g ( Ul r - yU t ) ^ Oo ) (54) 和 （55) 中剩下的 O 项来自满足 （15) 的非零向量 （ Wl ，…， 

〜），并使用习题27中导出的界。（通过仔细地考察这个证明，我们可以把这些公式 

中的每个 O 代之以〖的一个显函数。）! 

■ 

式 （55) 同整个周期上的，维序列检验有关，而式 （54) 给岀了当 iV 小于 m 且不 
是太小时，关于头 JV 个生成值的分布的有用信息。注意， （54) 仅当 s 充分大时才保 

证低差异，否则 m \^~ s 项将占主导地位。如果 m =的…於和 gcd ( <2 - 1 ， m ) = 
A ，则由引理 3.2.1.2 PJ 等于/ 厂 △ …\于是的极大值对应于高效 


能。在 m = 2 e 和 a 三 5( modiil 0 8) 的普通情况下，我们有 s | m ，所以 D 屮是 
0(/^ (log m) t + 1 lN ) + 0 ((\og m ) t r max ) 0 不难证明 



max 




1 

V 8 v t 


(56) 


(见习题 29)。 因此等式 （54) 特别说明，如果谱检验能够通过且如果 A / 稍大于 

v^Clog mV + 1 ， 则在 z 维中差异将是低的。 

在某种意义下，定理 N 几乎太强了，因为习题30的结果表明，像表1的行8和 

行13那样的线性同余序列在二维中有阶为 （bg m ) 2 lm 的差异，这种差异是极小 


的，尽管存在一些面积约为的平行四边形区域不包含点 （ 队，卩„ + 1 )。当把 
点转动时，差异可以如此急剧地改变，这一事实警告我们，序列检验作为对随机性的 
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种度量，可能不像转动不变量谱检验那样有意义 


G . 历史评述 1959年，在推导用蒙特卡罗方法计算〖维积分中误差的上界时， 
N . M . Korobov 设计了对一个线性同余序列的乘数评级的方法。他的稍微复杂的公 
式同谱检验有关，因为它受 （15) 的“小”解的强烈影响；但不完全相同。 Korobov 的检 

验是 Kuipers 和 Niederreiter 在 Um ./ om2 Distribution of Sequences (New York ： Wiley , 

1974, §2.5) 中综述的大量文献的主题。 

谱检验首先是由 R . R.Coveyou 和 R . D . MacPherson[JACM 14 (1967)，100〜 

119] 系统阐述的，他们以间接有趣的方式介绍了它。他们不是利用逐点的栅格结 
构，而是把随机数生成程序看做是〖维“波”的源。他们当初的论述中使 A +…+ 


a ~ 1 (modulo m ) 的数 V d +…+ : c 〗 是波的“频率”，或者是由随机数生成程序 

定义的“谱”中的点，而且低频率的波对随机性是最有损害的； 谱检验 的名称由此而 
来。 Coveyou 和 MacPherson 介绍了实施他们的检验的类似于算法 S 的一个过程，其 
基础是引理 A 的原理。然而最初的方法（使用矩阵和 W T 而不是 U 和 V ) 
处理的是非常大 的数； 直接用 U 和 V 的思想是由 F _ Janssens 和 U . Die ter 独立提出 
的。 Comp . 29 (1975) ,827~833 0 ] 

若干其他作者指出，谱检验可以以具体得多的术语加以 理解； 通过引入对应于 
线性同余序列的格栅和格结构的研究，关于随机性的基本极限在图形上就变得清楚 


了，见 G. Marsaglia , Proc. Nat. Acad. Sci. 61( 1968) ， 25 〜 28; W • W .Wood , J. Chem. 

Phys. 48 ( 1968 )，427 ; R • R . Coveyou ， Studies in Applied Math. 3 ( Philadelphia ： 
SIAM, 1%9) ， 70 〜 111; W . A . Beyer ， R . B.Roof 及 D . Williamson ? Math . Comp. 25 


(1971) ， 345 〜 360; G . Marsaglia 和 W . A . Beyer , Applications of Number Theory to 
Numerical Analysis, S . K.Zaremba 编 （New York ： Academic Press ，1972) ， 249 〜 285 ， 


361 〜370。 

通过使用指数估计， R . G . Stcmeham 证明，当 a 是模素数 P 的一个原根时，序列 
a k X 0 mod p 的夕 1/2 + f 或更多的元素有渐近的小的分布 [Acta Arithmetica 22 (1973)， 

371 〜 389]。如同在上面所说明的那样，这一工作为 Harald Niederreiter 的一些论文 
所推广 [ Math . Comp . 28 (1974) , 1117 — 1132； 30 ( 1976)，571 〜 597 ; Advances in 
Math. 26(1977), 99 - 181; Bull Amer. Math. Soc. 84 (1978) ， 957 〜 1041 ] 。 也可参 

见 Niederreiter 的著作 _Randorn Number Generation and Quasi-Monte Carlo Methods 

( Philadephia : SIAM , 1992) 0 


习题 

1. [M10] 在一维中谱检验归结成什么？（换言之，当？ = 1 时发生什么情况？） 

2. [HM20] 设， … ，是 z 维空间中的线性无关向量，设 “ 是由 （ 10) 定义的点的格，并设 

K ， … ， U t 由 （ 19) 定义。证明对于包括的所有平行超平面族，〖 -1 维超平面间的极大距离是 
llmm\ f(x\ ， … ， : cWh ， … ， xj#(0, … ， 0)1 ，其中 / 在 （ 17) 中定义。 
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3 -[M 24 ] 对于效能为 2 和周期是 m 的所有线性同余生成程序确定和 v 4 。 

► 4 . [ M 23 ] 设 “ n ， w 12 ， “21 ， w 22 是使得 “11 + ⑽ 12 三 w 2i + aw 22 三 0 (modulo m ) 及 u n u 2 2 ~ 


u 2 \ u n = M 的一个 2 X 2 整数矩阵的元素。 


a) 证明同余: y! + a^2=0( modulo m) 的所有整数解（力，: y 2 ) 有形式（: yi ,3^2) - (^i w n + x 2 u 2 \ , 

文 1 “12 +工 2 “ 22 ) ，其中 工 1 ，工 2 是整数。 

b) 另外，如果2| u n u 2 \ + u n u 2 2 I + u \ 2 ^ u \\ + 也成立，证明在同余式的所有非零解 
中，（: yi，：y2) 二 （Mil ， w 12 ) 使 y \ + y \ 达到极小。 

5 . [ M 30 ] 证明算法 S 的步骤 S1 到 S3 正确地实施二维中的谱 检验。 [提示 ：见题 4并证明在 
步骤 S2 的开始 （/?/ + h ) 2 + ( p ' + p ) 2 ^ h 2 + p 2 0 ] 

6. [ M 30 ] 设 a。 ，〜，…，^是 3.3.3 小节中所定义的 <2/772 的部分商，并设 A = maxo^^^o 

证明户2 〉2 丌 /(A + 1 + l/A) 0 

l .[ HM 22 ] 证明当，…，，…，&是实数时，式 （23) 后面的问题 a ) 和问题 b) 有同 
样的解（参见（24)，（26))。 

8.[Mi 8] 表1的行10有一个非常低的 仏值 ，但&是令人满意的。当& = 1CT 6 和 m = 
10 1() 时 ，化 可能的最高值是什么？ 

9 . [ HM 32 ] (C. Hermite, 1846) 设/(:^，…，而）是如同在 （17) 中那样由矩阵 L7 定义的一个正 

/ d \ ^ _ 1)/2 

定二次型，并设0是/在非零整数点上的极小值。证明 ^<(y ) \ detU \ 2h 0 [提示 ：如果 


W 是行列式为1的任何整矩阵，则矩阵 WL 7 定义等价于/的一个二 次型； 而且如果 S 是任何正 


交矩阵（即 


1 


S 



则矩阵 LJS 定义恒等于/的一个二次型。证明有一个等价的二次型^•，其 


极小值 <9在（1，0,…， 0) 处出现。然后通过对/用归纳法证明一般结果，写 g •(:^， 


x 


)^6{ 


x 



召 2 工 2 + …+ Ptpc ,) 2 + "(工 


2， 


參 4 _ 


，: rj ， 其中 / i 是〖 -1 个变量的一个正定二次型。] 


10 . [ M 28 ] 设 3 M 和： y2 是使得 3^1 + a 力三 0 (modulo m ) 和： y ? + ： y 〗< V 4/3 m 的互素整数。证 
明存在整数心和 " 2 使得 u J +皿 2 三 0( modulo m ) yUi y>2 ~ u 2 y \ - m ,2 I u { yi + ^ 2^2 I ^ min ( u\ + 
^2 + ：yD 且（以？ + u\){y\ + ： yg)>m 2 (因此 由习题 4，v 卜 min( u\ + i4，：yf + 3 ^))。 

► ll.[HM30](AIan G . Waterman , 1974) 试设计岀计算乘数 ^ = 1 (modulo 4) 的一个相当有效 
的过程，对于这个乘数，同余式 + 町 2 三0 (modulo 777) 存在互素的解且有 y\ y\ = \/4/3 m _ ( ， 

其中给定爪二 2 e ， f 〉0 尽可能小。（由习题10, a 的这 一 '选择将保证4>7?2 2 /(3^ + 3 ^)〉\/ 3/4 m 

而且存在4接近它的最优值的可能。实践中，我们将计算若干个有这样的小的 < 的乘 
数，并选择有最好的谱值 y 2 ， v 3 ，…的一个。） 

12. [ HM 23] 不用几何图示，证明正文的问题 b ) 的解必定也满足方程组 （26 h 

13. [ HM 22] 引理 A 利用 L 7 的非奇异性来证明一个正定二次型在非零整数点上达到一个确 

| 

定的非零极小值。给出一个系数矩阵为奇异的二次型（19)，使得在非零整数点（^，…，^)处， 
/(^，…，^)的值任意地接近零（但不达到零），以证明这个假设是必要的。 

14. [24] 对于 m = 100 , a =41，了 = 3,手工实施算法 S 。 

► 15.[ M 20] 设 L 7 是满足 （15) 的一个整向量。问有多少个由 L 7 定义的 r -1 维超平面交于单 
位超体丨 ，…， a )| 对于(这近似于族中足以覆盖 Lo 的超平面的个数。） 

16.[ M 30]( U . Dieter ) 说明如何修改算法 S 以便计算如题15中那样交于单位超体的平行超 
平面的极小个数 N〆 取遍满足 （15) 的所有 U ) 0 [提示：正定二次型和引理 A 的适当的类比是什 
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么？] 

17.[20] 修改箅法 S , 使得除计算量 v , 外，它还输出满足 （15) 的所有整向量，使得对于 2 <t 

十… + u 2 t = v 2 t 。 

IS .[ M 30] 本习题是关于算法 S 的最坏情况的。 

a ) 通过考虑其元素有 ）+減：； （请见习题 1.2.3-39) 形式的“组合矩阵”，找出满足 （29) 的 3 x 3 

整数矩阵 L 7 和 V ，使得对于任何_；，步骤 S 5 的变换什么也不做，但是 （31) 中对应的;^值是如此之 

大，以致穷尽查找根本不可能。（矩阵 L ； 不必满足 （28); 这里我们感兴趣的是行列式 77 Z 的 任何正 
定二次型。） 

b ) 尽管变换 （23) 对于 a ) 中所构造的矩阵没有什么用，但试求出确实产生相当大简化的另一 
个变换。 

► 19.[ HM 25] 假设稍微改变步骤 S 5, 使得当2%.时对9 = 1做一变换。（于是每 
当时 g = L ( V , • V ; / V , * v ; ) + 1/2」。）问算法 S 是否可能进人一个无穷循环？ 

20. [ M 23] 试讨论对于^=0，心为奇数， mod 8 = 3 或5的线性同余序列，如何实 
施适当的谱检验。（见习题 3.2. 1.2-9。） 

21. [M20](R.W.Gosper) 以 4 个一批来使用随机数，但“拋弃”每组中的第二个。给定周期 
m =2〃 的一个线性同余生成程序，如何研究丄 （ X 4 „， X 4 ，, + 2 ， X 4 ，, + 3 ) 的栅格结构？ 

22. [ M 46] 假 定以非 常接近于它的极大值 v ^ tt ， 什么是&的最好上界？假定&非常接 
近于它的极大值乃，什么 是；^ 的最好上界？ 

23. [ M 46] 设 U i , 是对于满足 LV %.=心的实数向量，且使得对于 i 竽 j ， U r 

U , = u 2| 2| %。问 A 能有多大？ （如果 （23) 和习题 18 b ) 的变换 

都不能做任何约简，则这个问题同步骤 S 7 中的界有关。已知要达到的极大值是（〖十 2)/3, 对于 

2« t ，当 a ^/^ L /^ y/i + yVS /,, =厂 _ ( i 2 + …+ U / W ， V , =2心/力时它出现，其中 

( /〖，…， O 是单位矩阵;这个构造属于 B . V . Alexeev 。) 

* 

► 24.[ M 28] 把谱检验推广到形如 X n = { aX n ., + bX n . 2 ) mod f ，并有周期长度 p 2 _ 1的二阶 

序列（参考式 3.2. 2-(8))，应如何修改算法 S ? 

25. [ HM 24 ] 设 d 是7?2的一个因子，且设证明遍取使得6 mod d 二 q 的所有 
々〈所所求的和数2^(/0，其值顶多是（2/<^71：)111(772/(^) + 0(1)。（这里当 Ml 时 r (々） 在等式 
(46) 中定义。) 

26. [ M 22] 说明对于 0< g < m ， 为什么 （53) 的推导导致对 

0^ n<N 

的一个类似上界。当 m = l 时， （53) 的推导在何处出问题？ 

27 . [ HM 39 ] (E • Hlawka ， H • Niederreiter ) 设 ，…， w r ) 是 （46) 中定义的函数。试证明，若 

对使得（^，…，〜）参（0,…， 0) 和 （15) 成立的所有 ，…， u L < m 取和 SrUi ，…，〜），其值至 
多是 2( (7 r + 2 tt lg m) l r mKX ) ，其中 r max 是在和数中的极大项 r ( u !，*•*, u r ) 0 

► 28.[ M 2 S ]( H . Ni e deireit er ) 在 m 为素数 ， c = 0 ，a 为取模 m 的原根，笋 0( modulo m ) 的情 

况下，求与定理 N 相类似的一个定理。 [提示 ：你的 指数和应当含〜也含 〔二 e 2WU - U 。] 证明在 
此情况下，“平均”原根有差异 DL 0 -! - 0 (/(log - 1))，因此对于所有 m ， 存在好的原 
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29. [ HM 22] 证明习题27的量 r _ 绝不大于 1/ VSv ,。 

30 . [ M 33 ] ( S . K . Zaremba ) 证明在二维中 r max — 0( max ( ，…， aj / m )， 其中 <^，…，是应 
用欧几里得算法于 m 和 a 时得到的部分商。[提 示：在 4.5.3 小节的记号下，我们有 alm = // a l} 

, a s // ;应用习题4 . 5 . 3-42。 ] 

31 . [ HM 4 7 ] ( I . Boros h ) 证明对于所有充分大的 m , 存在一个数 < 2 与 m 互素，使得 a ! m 的所 
有部分商小于等于3。其次满足这个条件但所有部分商小于等于2的所有 m 的集合有正的密 
度。 

► 32 . [ M 21 ] 设 1 = 2 31 - 1 和 m 2 — 2 31 - 249是生成程序 （38) 的模数。 

a ) 证明如果 U n = ( Xjm { - Yjm 2 ) modi ， 则我们有 U n ^ Zjm 10 

b ) 设 Wq = ( X 0 m 2 ~ Y ^ m v ) mod w 和 + ! = aW n mod m ， 其中 a 和 w 有在 （38) 之后的正 
文中所述的值。试证明在和 K 之间存在一个简单的关系。 

^ 在本书的下一版中，我计划引入一个题目为 “ L 3 算法”的新的 3.3.5 小节。它 
将从随机数的一般课题扯开去，但它将继续 3.3.4 小节中格约简的讨论，它的主要 
课题是 A . K . Lenstra ， H . W \ Lenstra ， Jr.S L . Lovasz [ Math . Annalen 261 (1982) , 515 

〜 534] 用于求基向量接近最优的集合的现代经典算法，以及随后其他研究者对该算 
法的改进。后者的例子可从下列论文及他们的参考文献中找到： M . Seysen ， Com hi - 
natorica 13 (1993) ,363^ 375; C . P . Schnorr fll H . H . Horner , Lecture Notes in Comp . 

ScL 921 n995),l 〜 i2 。 

3.4 其它类型的随机量 

我们现在已经看到如何使一台计算机生成序列 ，…， 这个序列的特 

性是似乎每个数都以一致分布的方式在0和1之间随机地选择。然而，随机数的应 
用通常要求其它类型的 分布； 例如，如果我们 要从& 个可能中进行随机选择，我们就 
要有1和々之间的随机 整数。 如果某个模拟过程要求在独立事件的出现之间有一 
个随机等候时间，则需要具有指数分布的一个随机数。有时我们甚至不要随机数 
——我们要一个随机排列（即72个对象的一个随机安排）或一个随机组合（即从 n 
个对象的集合中选择 A 个对 象）。 

从原理上说，任何这些其它的随机量都可以从一致偏离 U Q ， U :， L / 2 , …中得 

到。人们已经想出一些重要的“随机技巧”，它用于对一致偏离进行有效的变换。对 
于这些技术的研究使我们对在蒙特卡罗方法的应用中如何适当地使用随机数有了 
进 一 ^步的 洞察。 

可以想像，有一天某人将发明一个随机数生成程序，它能 直接地 ，而不是间接地 
通过一致分布产生出这些其它的随机量之一。但是除了在 3.2.2 小节所描述的“随 
机位”生成程序之外，至今还没有已被证明是实用的直接方法。（请见习题 3.4.1- 
31,其中一致分布主要用于初始化，在那之后这个方法就几乎完全直接了。） 
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下面一节的讨论假定在0与1之间一致分布的一个实数随机序列的存在性。 
当我们需要时，就可以生成一个新的一致偏离 U 。 这些数通常以一个计算机字表 

示，并假定小数点在左边。 

3.4.1 数值分布 

这一节综述由各种重要的分布类型产生数的已知的最好的技术。其中许多方 
法最初是由 John von Neumann 于20世纪50年代初提出的，而后逐渐地由其他人主 
要是 George Marsaglia ， J ■ H • Ahrens 及 U . Dieter 加以改进。 

A . 从一个有限集合随机选择 实用上要求的最简单最普通的分布类型是一个 
随机 整数。 0与7之间的一个整数可以在一台二进计算机上从 U 的三个二进位中 
抽取 出来； 在这种情况下，这些二进位应从计算机字的最高有效位（左边）部分抽出， 
因为由许多随机数生成程序产生的低有效位是不充分随机的（见 3.2.1.1 小节中的 

讨论）。 

一般地说，为得到0与々 -1 之间的一个随机数 X ，我们可以乘以々，并设 X = 
L 々 L 7」。 在 MIX 上，我们将写成 


LDA U 

MUL K 



在这两条指令被执行之后，所需要的整数将出现于寄存器 A 中。如果所需的是1与 
k 之间的随机整数，那么往这个结果上加 1( 把指令 “INCA 1”接在 （1) 之后）。 

这个方法以几乎相等的概率给出每个整数。由于计算机字长的有限性而略有 
误差（见习题 2 )。 但如果 A 是小的，例如，如果 Wm<l/I0000, 则这个误差是完全 

可以忽略的。 

在更一般的情况下，可能要求对于不同的整数给出不同的权。假设得到值 x = 
&的概率为以，得到值 X = x 2 的概率为/> 2 ,…，得到值 乂二 的概率为九。我们 

可以生成一致的数 L ；， 并令 

如果0< <仏 

X 2 y 如果 P \ V K p { + p 2 ,、 

x = s . ⑵ 

參 

■ 

.0 C k ,如果 Pl 十 />2 + …+ Pk-l U < I 


(注意： + 九 + … + pk = 1 o ) 

有一个“最好”的方法来进行 (2) 中所隐含的 U 与 Pi + P 2 + …十 A 的各种值的 
比较； 在 2.3.4. 5 小节中讨论了这种情况。特殊情况则可以用更有效的方法 处理; 

例如，为了分别以骰子概率 H “， 磊，…，磊，壶得到 11 个值 2,3,…，12 之一， 

我们可以计算1与6之间的两个独立的随机整数，并把它们加在一起。 

然而，基于由 A.J. Walker 引入的巧妙方法[幻 ecfronics Letters 10,8(1974) , 127 
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128 ; ACM Trans • Math . Software 3(1977) ,253 




256]， 实际上有一个以任意给定 


的概率来选择&，•••，&的快速方法。假设我们形成并分别地考虑整数部分 K 


UL /」 和分数部分 V 


( kU ) mod 1;例如，在代码 （1) 之后我们将有 K 在寄存器 A 


中和 V 在寄存器 X 中。然后通过进行下列操作我们总能得到所需的 分布： 对于某 


些适当的表 （ P Q ， 




# 4 » 


U ， 


如果 v < p K , jay x 


x K + l 


否则 x 


< — 


Y !< 


(3) 


习题7说明 


般地应如何计算这样的表 0 Walker 的方法有时称做“别名”方法 


在一台二进计算机上，假定 々是 2的幂通常是有帮助的，这使得乘法可用移位 


来 代替； 不失一般性，通过引进以概率0岀现的另外的一些 X 值可以做到这 


点 


0 


例如，再次考虑骰子;假设我们要 X 


i 以下列16个概率 岀现: 




0 


2 


3 


4 


5 


6 


7 


8 


9 10 11 12 13 14 15 



° ° 36 36 36 36 36 3~6 36 ^6 36 36 3~6 ° 


0 


0 


如果々 




16和对于0<2<16，工 7 + 1 =』，而且如果] ：) 表和 y 表建立如下 




0 


2 3 


4 


5 


6 


7 


8 


9 10 11 12 13 14 15 


P 


0 0 


4 

9 


y ； 


5 9 7 


8 

9 

4 






1吾吾吾告。。0 




6 




* 


关 


8 4 7 10 6 7 


8 


则我们可以用 （3) 来做此事。（当 P , 


1时，不用 K 。） 例如，如所要求的那样，值7 


以概率 


16 


_ 


((1 - P 2 ) + P 7 + (1 ' Pn) + (1 - Pi 4 )) 





36 


岀现。它是掷骰子的一个特 


殊方式，但这些结果并不异于实际事物 

概率九可以通过非负的权 


权的和，则九= 
[SODA 4 (1993),361 
生成 X 。 


2通过非负的权， w 2 ，…，含蓄地表 7 K ;如果我们以 W 表不诸 
wJW 0 在许多应用中个别的权动态地变化。 Matms ， Vitter 和 Ni 




370] 已经说明如何在一个固定的预期时间内修改一个权和 


B . 连续分布的 一 般分法 


借助于“分布函数” FU )， 可以表达最一般的实值分 


布。这个函数确定随机量 X 不超过 x 的 概率: 


F ( x ) 

这个函数总是单调地从0增到1，即 


Pr ( X < 


X 


(4) 


F ( x { ) ^ F ( x 2 ) j 如果:^ < : r 2 ; 


F (- 


OO 




0, 


F (+ 00 ) 




⑸ 


在 3.3.1 小节图3中给出了分布函数的一些例子。如果 F (: r ) 是连续和严格递增的 
(使得当时， FUJCFUD ), 它取0与1之间的所有值，而且有一个逆函 

数 F [ _ 1 ]( 30 , 使得如果 0 <)< 1 ， 


: y 




F ( x ) 


当且仅当 


X 


F 


[―1 


b ) 


( 6 ) 


般来说，当 FU ) 是连续和严格递增时，通过置 

X = F [ " 1] ( L 7) 
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3.4 其它类型的随机量 

我们可以用分布 FU ) 计算一个随机量 X ，其中 L 7 是一致的。可以这样做是因为 

的概率是 F [ — 1] (!7)<工的概率，即(: r ) 的概率，而这是 F ( x ) 0 
现在问题归结为一个数值分析问题，就是找出计算到所需精度的好 
方法。数值分析不属于本书所谈的半数值的范围；但其中有一些重要的可利用的捷 

径来加速 (7) 这 一一 般方法，因而我们将在这里考虑它们。 

首先，如果 A 是分布为心（工）的一个随机变量，而且如果 X 2 是分布为 F 2 (x) 

的一个独立随机变量，则 

max ( X 1 , X 2 ) 的分布为 F 1 (^ c ) F 2 ( x ) 

mm ( X l , X 2 ) 的分布为 F { ( x ) + F 2 ( x ) - F 1 ( x ) F 1 ( x ) 

(见习题4。）例如 ，一 致离差 L 7 对于0<工<1的分布是 = 如果 

U t 是独立的一致离差，则 0< x < l 的分布函数是 F ( x ) 

= V 。 这个公式是 3.3.2 小节中给出的、的极大值”检验的基础。它的逆函数是 

F [ - i ] (3 ；)= 石。因此，在 t =2 的特殊情况下，我们可以看到两个公式 

X = 和 _X = max ( U \ , U2 ) (9) 

给出随机变量 X 的等价分布，尽管乍一看去这并不显然。我们不需要取一致离差 
的平方根。 

像这样的技巧是不胜枚 举的： 任何运用随机数作为输入的算法都给出具有某种 
分布的随机变量作为输出。问题是给定输岀分布函数，如何找岀构造这个算法的一 
般方法。我们将避开以纯粹抽象的术语讨论这样的方法，而是将研究在一些重要情 

况下如何应用它们。 


C . 正态分布 也许最重要的非一致的连续分布是具 有均值 0 和标准差 1 的正 
态分布 

F ( x ) = — ^ 

/2tt 

在 1.2.10 小节中指出了这个分布的重要性。在这种情况下，逆函数厂 [_1] 不是特别 
容易计算的，但我们将看到有若干其它技术可以利用。 

1) 配极法是由 G . E . P . Box , M • E ■ Muller 及 G • Marsaglia 给出的（见 Annals 

Math . Stat . 29 (1958) , 610〜611;以及波音科学研究实验室报告 D 1-82-0203 
(1962)) 0 



算法 P (正态离差的配极法） 这个算法计算两个独立的正态分布变量 X 〗和 

X 2o 

P 1. [得到一致变量]生成0与1之间一致分布的两个独立的一致分布变量 A 

和 L / 2 o 置 - 1, V 2 ^2 U 2 -lo (现在％和 V 2 是 _ 1 和十1之间一 

致分布的，在大多数计算机上，以浮点形式表示 K 和 V 2 是更可取的 Q ) 

P 2 .[计算 S ] 置 S — W + W 。 
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P 3.[ S >1?] 如果 S >1， 返回步骤 P 1。 （步骤 P 1 到 P 3 平均执行 1.27 次，标 

准差为 0.587; 见习题6。） 

P 4 •[计算 X !， X 2 ] 如果5 = 0,置 X ! — X 2 — 0;否则置 


A 


V ! 


- 2 In S 


S 


， X 2 


V 


-21nS 


S 


这些是所需的正态分布变量。 



为证明这个方法的正确性，我们使用初等解析几何和微积分。如果在步骤 P 3 
中 S <1， 则在平面中具有笛卡尔坐标 （ V ^ V 2 ) 的点是在单位圆内一致分布的随机 

点。变换成极坐标 V { = R cos ® y V 2 = R sin 0，我们求得 

S ~ R 2 } X x = V ~ 2 \n S cos @ ， X 2 二 V 7 - 2 In S sin ® 

也使用极坐标 X ! = R'cos S ' , X 2 = R'sin ，我们求得 & 和只 ’ = \! - 2 In S 。 
显然 f 和0/是独立的 ，因为 只和0是在单位圆内独立的，而且，0'在0和 2 tc 之间 

—致分布。 R ，< r 的概率是 -2 In S < r 2 的概率， g 卩 S > e 〃 2/2 的概率。这等于1 _ 

e — ” 2/2 ,因为5 =尺 2 是在0和1之间一致分布的。因此，位于 r 和 r + dr 之间的 

概率是 l - e - 的微分， g 卩 re '^ dro 类似地， K 位于6和6 M 之间的概率是 （1/ 
27 u ) d@o 和 X 2 <: r 2 的联合概率现在可以计算 出来； 它是 

^ e _r ^ 2 rdrdd = 

J I ( r ，沒 ） 1 厂 cos d^j ： ^ ，厂 sin 丨 2TC 

e - ^ )l2 dxdy = 



像所希望的那样，这证明了 Xi 和 x 2 是独立的。 

2) 由 G . MarsagHa 引进 的矩形-楔形-尾形方法。 在这个方法中，我们使用分布 

F ( x ) = erf ( x / 42) -- e~ l l2 dt , x ^ 0 (12) 

V 7T J o 

Hx ) 给出正态离差的绝 对值的 分布。在按照分布 （12) 计算了 X 之后，我们就对它 
的值附加一个随机的正负号，这使它成为一个真正的正态离差。 

矩形-楔形-尾形方法是以若干重要的一般技术为基础的，我们将在随后建立此 
方法的过程中剖析这些技术。主要的思想是把 FU ) 看成若干其它函数的一个混 
合，即写成 

F ( x ) = + p2F 2 ( z ) + …+ p n F n { x ) (13) 

其中 Fi ， F 2 ，…，是适当的分布，仏，/^，"•，九是和为1的非负概率。如果我们 
通过选择具有概率外的分布 F ； 生成一个随机变量 X ，容易看出 X 整个地将有分布 
F 。 某些分布尽（: r ) 可能稍难处理，甚至比 F 本身 更难； 但是我们通常可以把事情 
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安排成使得在这种情况下概率岛是非常小的。大多数分布 GU ) 将十分易于调 

节，因为它们只是对一致分布稍加修改而已。得到的方法提供了一个非常有效的程 
序，因为它的平均运行时间非常短。 

如果我们以分布的导数而不是以分布本身进行处理，则易于理解这个方法。设 

fix ) = F '( x ) , = F ’ j ( x ) 

这些称为概率分布的密度函数。等式 （13) 变为 

/( X ) = p ^ f x ( x ) + 户 2 /2(工）+ …+ PrJn (工、 (14) 

每个 力 （ I )非负，而且，在力卜）的图形之下的整个面积为1;所以有一个方便的图 
形方式来表示关系 （14):/( X ) 之下的区域分成 n 部分，而且对应于力（工）的部分之 

面积为朽。请看图9,这里它描述了我们感兴趣的情形，其中 /( dip " “）= /&• 

e ^ 2/2 ; 曲线之下的区域已经分成= 31部分。有15个矩形，它们代表〜/“工），…， 

Pl5/l5(Z) ;有15个楔形块，它们表示 Pl6/l6 ( 工 ） ，…， P 30 /30 (工）；还有剩下部分 
如 AU) 是“尾形”，这即当工>3时/(工）的整个图形。 

0.9 
0.8 
0.7 
0.6 

0.5 
0.4 

0.3 
0.2 
0.1 
0.0 

图9密度函数分成31部分，每个部分的面积表示 
具有该密度的一个随机数的有待计算的平均次数 

矩形部分/!(: C ) ，… ，/ 15 (: c ) 表示一致 分布。 例如， / 3 (: c ) 表 在香和 ■之 间一 

致分布的随机变量。(工）的高度是 /( j /5)， 因此第 J 个矩形的面积是 

Pj = =7 J ^ 2/5 °, 对于 (15) 

为了生成分布的这种矩形部分，我们只须计算 

X = jU + S (16) 

其中 L 7 是一致的，而 S 以概率巧取 ( j -1)/5 的值。由于 f …+ { 15 = 0.9183,因 
此我们可以在大约 92% 的时间里使用像这样的简单一致离差。 
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在剩下的8%当中，我们通常将要生成楔形分布 F 16 ，…， F 3 Q 之 一 。我们需要做 

的事情的典型例子如图10所示。当： c < l 时，曲线部分是向下凹的，而当： c > l 时 
它是向上凸的，但在每种情况下曲线部分相当接近于直线，因而它可以包括在两条 
平行线之间，如图所示的那样。 



图10密度函数，它们可被算法 L 用来生成随机数 


为了处理这些楔形分布，我们将依赖于另一项一般技术，即冯诺伊曼为从“包 
围”一个复杂密度的另一个密度得到这个复杂密度的拒绝方法。上边描述的配极法 
是这种方法的简单例子 ：步骤 P 1 〜 P 3 首先在一个较大的正方形内生成一个随机点， 
如果该点在单位圆的外部就拒绝它并重复该步骤，最后得到在单位圆内的一个随机 
点。 

一 般的拒绝方法甚至比这还更加有效，为生成具有密度/的随机变量 X ，设 g 
是使得对所有^ 


f ( t ) < cg ( t ) (17) 

的另一个概率密度函数，其中 c 是常数。现在按照密度 g 生成 X ，还生成一个独立 
的一致离差 U 。 如果 L 7>/( X )/ 叹（ X )，则拒绝 X 并再次以另一个 X 和 L 7 开始。 
当条件 L 7</( X )/ 叹（ X )最终出现时，得到的 X 将有所需的密度/。[证明: 

将以 p ( x ) = ( g ( t)dt • f ( t ) lcg ( t )) + qp ( x ) 的概率出现，其中量 <?= 

J — GO 

( g ( t)dt • (1 - f ( t )/ cg ( t ))) = 1 - 1 /c 是拒绝的概率，因此 p ( x ) = 

J — oo 

f ( t ) dt 0 . 

CO 

当 C 很小时，拒绝技术是最有效的，因为在接受一个值之前，平均将有 C 次迭代 
(见习题6)。在某些情况下， / U )/ wU ) 总是0或1;此时 L 7 不必被生成。在其它 
情况下，如果 / U )/@( x ) 难以计算，我们可以在两个界函数之间来“挤 ”它： 

r ( x ) ^ f ( x ) lcg ( x ) ^ s ( x ) (18) 

这些界函数是简单得多的函数，而且除非否则 / U )/ Cg U ) 的精 
确值不必计算。以下的算法通过进一步建立拒绝方法，解决楔形问题。 
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算法 L (近乎线性的密度） 这个算法可以用来生成一个任何分布的随机变量 


X ，其密度 / U ) 满足以下条件(参考图 10)： 


/( 


x 


0, 


对于 


及 ： c > 


a 


— b(x - s)lh ^ f ( x ) ^ b - b(x — s ) Ih ， 


LI . [获得 U < V ] 生成在 0 和 1 之间的 


致 


O 


分布的两个随机变量 U ， V 。 如果 L /> V , 
则交换 UoV 。 

L 2. [容易的情况？]如果转向 L 4 

L 3. [再试？]如果 V > U +( llb 、 f(s + hU ), 

则转回到步骤 L 1。 （如果 a /6 接近于1，则 
算法的这一步经常是不必要的。） 

L 4 •[计算 X ] 


置 X 


s + hU 


O 



当达到步骤 L 4 时，点（[；， V )是图11中阴影区 
域中的一个随机点，即 0< L /< V < L /+ ( llb ) f(s + 

hU ) 0 条件 (19) 确保 


0 — ► U x 

图11算法 L 中“接受 

的区域 


a 



KU + 


\fU + hu)^i 


现在对于 + 的概率是图11中垂直线 L 7 = : c 左边的面积，除以整 

个的面积，即 



0 



/( 5 + hu )d 


u 




^ 5 + hx 

f ( v)dv 


因此 X 有正确的分布。 

使用适当的常数算法 L 将对处理图9的楔形密度 f J + l5 o 

最后的分布 F 31 大约每隔370次仅须处理 一次； 即仅当要计算 X >3 的结果时才使 

用它。习题11说明对于这个“尾 巴”， 可以使用的一个标准的拒绝方案。因此我们 
可以全面考虑这个 过程： 


算法 M (正态离差的矩形-楔形-尾形方法） 这个算法使 用一些 辅助表 （ P Q ， …， 

尸31)， （ Ql ，…， Qi 5) ， （ Yo ，…， 丫31 ) ’ （ 之0，…， 之31 ) ，（&，•••， S 16 ) , ( D 16 ，…， D 30 ) ， 

(£ 16 ，…， £ 3 Q )， 其构造在习题10中有 说明； 例子见表1。这里假定使用的是一台二 

进计 算机; 对于十进计算机也可构造一个类似的过程。 

Ml . [得到 L 7] 生成一个一致的随机数 L /= (.6 0 hh 〜 h ) 2 。 （这里诸办是 

U 的二进表示的诸位。为了达到合理的精度，《至少应是24。）置 0 -^oc 

(以后0将用来确定结果的符号。） 

M 2. [矩形？]置（60 2 6 3 心6 5 ) 2 ,这是由17的前导位确定的一个二进数， 

同时置 /— (.心— 这是由剩余的位确定的小数。如果，则置 

+ 并转到 M 9 o 否则如果 J <15( gp 心=0)，则置 X — S ; + / Q ; 

• 111 • 










第 3 章随机数 


并转到 M 9。 （这是 Walker 的别名方法 （3) 的改编。） 

M 3. [楔形或尾形？](现在16< 7 <31而且每个具体值 J 以岛的概率出现。） 

若 j = 31则转到 M 7。 

M 4. [得到 U < V ] 生成两个新的一致离差 U 和 V ;若 L 7> V ，则交换 U ㈠ 

V 。（我们现在正实施算法 L 。) 置 X — S ; _ 15 + + U 。 

M 5 .[容易的情况？]若则转到 M 9。 

M 6. [另一次试验？]若 V > U + E ; ( e (S ^ l4 " X )/2 _ 1), 转回步骤 M 4; 否则转到 

M 9 0 (这一步被执行的概率很小。） 

M 7. [得到超尾离差]生成两个新的一致离差卩和 V ，并置 X —79-2 In V 。 
M 8 .[拒绝？]若 L 7 X >3, 则转回到步骤 M 7。 （这种情况岀现的次数大约仅是 

我们达到步骤 M 8 的次数的1/12。） 

M 9 J 加上正负号]若0 = 1置 X — - X 。 I 

这个算法是数学理论同程序设计才智紧密结合完全融汇的极好例子——这是 
计算机程序设计艺术的一个极好说明！在大多数时间里仅须实施步骤 Ml , M 2 和 
M 9, 而其它步也并不太慢。关于矩形-楔形-尾形方法最先的著作有 G . Marsaglia , 

Annals Math . St at . 32 (1961) ， 894 〜 899 ; G . Marsaglia , M . D . MacLaren 及 T . A . 
Bray,CACM 7(1964) ,4 〜10。 G . Marsaglia , K . Anathanarayanan 及 N . J . Paul 对算法 

M 做了进一步的改进 ， Letters 5 (1976)，27 〜 30。 
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3) 由 G . E . Forsythe 给出的奇偶方法。1950年左右 ， John von Neumann 和 G . 

E . Forsythe 发现，在具有一^般指数形式 

f ( x ) = Ce h{x) [a < b ] (20) 


的，度下，当 


0 < /i ( x ) < 1,对于 b 


( 21 ) 


时，有着惊人简单的生成随机离差的技术。这一思想是以前边描述的拒绝方法为基 
础的 ，令 ^"(i) 是 [a ， 6) 上的一'致分布：置+ ( 6 — a ) I /，其中 L / 是一致离差， 
然后我们要以 e _" ( 幻的概率接受 X 。当 V 是另一个一致离差时，对 e ^ ( x ) 和 V ，或 


对 / i ( X ) 和 - In V 做比较，可以完成后一操作，但无须应用任何超越函数，而以下列 
有趣的方式也可做这件事。置 / i ( X )， 然后生成一致离差 V ^， V 2 , …直到求得 

某个 K >1， 且 V K _ L < 为止。对于固定的 X 和々， / z ( X )> V ^的 

概率是 1 M ! 乘以因此 K 的概率 


是 h ( X ) k ~ l l(k 


-1)! - A ( X ) V 々！， 而且 K 为奇数的概率为 



h ( X ) 


一1 




(k - 1)! 


h { X ) 

k \ 


= e - A(x) 


( 22 ) 


因此，当 K 为偶数时，我们拒绝 X 并再次试验；如果 K 为奇数，我们就接受 X 作为 
具有密度 （20) 的一个随机变量。我们通常不用生成许多 V 以确定 K ， 因为 K 的平 


均值（给定 X )^ k >0 MK > k ) = ^ k >0 h ( X) k I k \ = e h ( x ) < e 0 


表 1 和算法 M —起使用的表举例 


1 J 



Q 】 

A 


4 

+ 16 

Sj + 1 

Dj + is 

E j^15 I 


.000 

.067 


0.00 

0.59 

0.20 

0.21 

0.0 



1 

.849 

.161 

.236 

- 0.92 

0.96 

1.32 

0.24 

0.2 

.505 

25.00 

2 

,970 

.236 

.206 

- 5.86 

- 0.06 

6.66 

0.26 

0.4 

.773 

12.50 

3 

.855 

.285 

,234 

- 0.58 

0.12 

1.38 

0.28 

0.6 

.876 

8.33 

4 

.994 

.308 

.201 

- 33.16 

1.31 

34.96 

0.29 

0.8 

.939 

6.25 

5 

.995 

.304 

.201 

- 39.51 

0.31 

41.31 

0.29 

1.0 

.986 

5.00 

6 

.933 

.280 

.214 

- 2.57 

1.12 

2.97 

0.28 

1.2 

.995 

4.06 

7 

.923 

.241 

.217 

- 1.61 

0.54 

2.61 

0.26 

1.4 

.987 

3.37 

8 

mi 

,197 

.275 

0.67 

0.75 

0.73 

0.25 

1.6 

.979 

2.86 

9 

1.000 

.152 

.200 


0.56 


0.24 

18 

.972 

2.47 

10 

.691 

.112 

.289 

0.35 

0.17 

0.65 

0.23 

2.0 

.966 

2.16 

11 

.454 

.079 

.440 

- 0.17 

0.38 

0.37 

0.22 

2.2 

.960 

1.92 

12 

.287 

.052 

.698 

0.92 

— 0.01 

0,28 

0.21 

2.4 

.954 

1.71 

13 

.174 

.033 

1.150 

0.36 

0.39 

0.24 

0.21 

2.6 

.948 

1.54 

14 

.101 

.020 

1.974 

- 0 ■ 02 

0.20 

0.22 

0.20 

2.8 

.942 

1.40 

15 

.057 

.086 

3.526 

0.19 

0.78 

0.21 

0.22 

3.0 

.936 

1.27 

* 实际应用中，这些数据将以更高得多的精度 给出； 本表仅示出足够的数字使得感兴趣的读者 

可以检查他们自己的程序以便更精确地计算这些值。值 Q 0 , Y 9 ,2 9 ， D 15 ，£ 

15 未用 

1 


若干年以后， ForS y the 认识到这个方法导出了计算正态离差的一个非常有效的 

方法，而无须像在算法 P 和 M 中那样，使用任何辅助的子程序来计算平方根或对 
数。他的过程连同 J . H . Ahrens 和 U . Dieter 给出的改进了的区间 [ a 乃 ） 的选择，可 
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综述如下： 

算法 F (正态离差的奇偶法） 在一台近似地有 《+ 1位精度的二进计算机上， 
本算法生成正态离差。本算法要求有一张对于+ 1的值4 =屮-^的 


表，其中是由关系 



定义的。 


(23) 


F1. [得到 L 7] 生成一个一致随机数 L 7 = (• 心幻…匕） 2 ，其中 b Q ， …， b t 表示在 


二进制下的诸位，置1及 a-Oo 
F 2. [求头一个为0的化 ]若 bj = 1，置 a — a + dj ， j—j + 1，并重复此步。（若 

j Z + 1 ，则视化为 0 。 ） 

F 3 .[生成候选者](现在。二七-!，而且 j 的当前值以约等于 2 — j 的概率出现。 

使用上边叙述的拒绝法，我们将在[屮—： ，屮） 的范围内生成 X ，且 h ( x ) = 
: c 2 /2- a 2 /2 二 //2+ g ， 其中 — 习题12证明，如 （21) 中所要求的， 


乘以"川且 V — (由于，•的平 


均值是2,通常在（.~ 


b t )i 


中有足够的有效值以提供合适的精度。在定 


点算术中做这些计算比较容易。） 

F 4 .[拒绝？]生成一个一致离差 LT ， 如果 V < 17,则转向步骤 F 5。 否则置 V 
成为一个新的一致离差；如果现在 V ( g 卩如果在上边的讨论中， K 为 
偶）， 则转回 F 3, 否则重复步骤 F 4。 

F 5 .[返回 X ]置 X—a + Y 。 如果4 = 1，则置 X 。 ■ 


在 Ahrens 和 Dieter 的文章 [ Math . Comp . 27 ( 1973)，927〜937 ] 中，给出 了对于 
1<_;<47时 < 的值; 他们的文章讨论了以更多的表为代价来改进算法的速度。算 

法 F 是吸引人的，因为它几乎和算法 M —样快，而且它更易于实现。每个正态离差 
的一致离差的平均个数是 2.53947; R . P . Birem[CACM 17(1974) ，704〜 705] 已经指 

出怎样以每节省一个一致离差花费两个减法和一个除法的代价把这个数减少到 
1.37446。 

4) 一致离差的比例。 还有另一个生成正态离差的好方法，这是1976年由 
A . J . Kmdermari 和 J . F . Monahan 发现的。他们的思想是在由 

0 < u ^ I, - 2u V ln ( \j u ) 《 v 《 2u %/ ln ( 1/ u ) (24) 

定义的范围内生成一个随机点 （ U ， V )， 而后输出比例 X — V / L ；。 图13的阴影区是 
使这个方法有效的魔术区域。在研究有关理论之前，我们首先叙述这个算法，以显 
示它的效率和简洁性。 

算法 R (正 态离差的比例方法） 本算法生成正态离差 X 。 

R1. [得到17, V ]生成两个独立的一致离差 L ； 和 V ，其中 L ； 非零，并置 X — 
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播 l V - V ) lu 。 (现在 X 是包含图13的阴影区域部分的矩形中一个 

随机点的坐标 ( 之比率。如果对应的点实际上位于“阴 
影”内，我们将接受 X ，否则我们将再次试验。） 



图13在正态离差的一致比例的方法中的“接受” 

区域，具有坐标比值工的线段长度有正态分布 

R 2 .[任选的上界测试]如果 X 2 <5-4 e lM L /， 输岀 X 并结束此算法。（如果 

愿意，此步可以 省去； 它测试所选择的点是否在图13的内部区域，以便省掉 
一次对数计算。） 

R 3 .[任选的下界测试]如果 乂 2 >扣_ 1 _ 35 /以+ 1.4，则转回尺1。（这步也可省 

去； 它测试所选择的点是否在图13的外部区域，以便省掉一次对数计算。） 
R 4 .[最后的测试]如果 X 2 <-4 lnL ；， 则输出 X 并结束此算法，否则转回 

Rio I 

习题20和21给出计时 分析; 分析了四个不同的算法，因为步骤 R 2 和 R 3 根据 
个人的爱好可以包括进来或省去。下表给出每步将被执行的平均次数，它取决于选 
用什么样的测试。 
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步骤 

全不用 

仅用 R 2 

R 1 

1.369 

1.369 

R 2 

0 

1.369 

R 3 

0 

0 

R 4 

1.369 

0.467 


仅用 R 3 全用 

1.369 1.369 

0 1.369 (25) 

1.369 0.467 

1.134 0.232 


因此，如果有非常快的对数运算，省去任选的测试是合算的，但如果对数子程序比较 
慢，则采用它们就比较合算。 

但为什么它行得通呢？ 一 个原因是我们可计算的概率，而且结果它是正 
确值（10)。但除非已碰巧触到了正确的“窍门”，不然这样一个计算是很不容易的， 
而且最好首先理解最初是如何发现这个算法的。 Kinderman 和 Monahan 是通过解 

决下列理论导出它的，这一理论对于任何特性很好的密度函数/(工）都可使用[见 
ACM Trans . Math . Software 3 (1977) ， 257 〜 260] 。 

一般说来，假设一个点 （ U ， V )已在由 

w > 0， u 2 ^ g ( vlu ) (26) 

定义的 （ W ， T ；) 平面的区域上一致地生成，其中 g 是某个非负可积函数。如果置 X - 
V / U ， 在由 （26) 中的两个关系加上辅助条件 vlu<x 所定义的区域上对 “ dr ; 积 
分，然后除以不带这额外条件的同样积分，可以计算 X < x 的概率。令加，使得 
dv = udt ，这个积分变成 


因此 X 之 oc 的概率是 




dt 


Vg(t) 

0 




g ( t)dt 



g ( t)dt 


(27) 


当 gO ) = e 〃 2/2 时得出正态 分布； 而且条件在此情况下简化成 
( W ^) 2 <-4 In 心容易 看出，满足这一关系的所有 U ， t ;) 的集合整个地包含在图 
13的矩形中。 

在步骤 R 2 与 R 3 中的界定义了具有较简单边界方程的内部与外部区域。对所 
有实数2成立的众所周知的不等式 


e 工 > 1 +工 

可用来证明，对任何常数 c >0, 

1 + In c - cu In u ^ l /( cu ) - 1 + In c (28) 

习题 21 证明 c = e 1/4 是用于步骤 R 2 的最好常数。在步骤 R 3 中情况要复杂，而且在 
此情况下似乎没有一个最优的 c 的简单表达式，但是计算实践表明对于 R 3 的最好 
值近似于^ 1 ‘ 35 。 当 u 二 lie 时，近似曲线 （28) 与真正的边界相切。 

通过把区域划分成小区域有可能得到一个更快的方法，大多数这些小区域可以 
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更快地处理。当然，这意味着，如同在算法 M 和 F 中一样，需要辅助表。 Ahrens 和 
Dieter 在 CACM 31 (1988) ，1330〜1337上已经提出了要求较少的辅助表表项的一 

个有趣的替代方法。 

5) 由正态离差出发的正态离差。 习题31讨论了一个有趣的方法，通过直接地 
以正态离差进行工作，而不是把每件事情都基于一致离差，它可节省时间。这个由 
C . S . Wallace 于1996年引入的方法在现时有相对较少的理论支持，但它成功地通过 

了一些经验检验。 

6) 正态分布的变形。 至今我们考虑了均值为0和标准差为1的正态分布 。如 
果 X 有此分布，则 

y = 11 + aX (29) 

有均值为"和标准差为^的正态分布。其次，如果 A 和 X 2 是具有均值为0和标 

准差为1的独立的正态离差，而且如果 

Y l - 十 a x X y Y 2 = /^2 + + VI ~ p 2 X 2 ) (30) 

则 h 和是 相关随 机变量，它们有正态分布，且均值为 A ， "2,标准差为 
相关系数为 〆 关于对”个变量的推广，见习题13)。 

D . 指数分布 在一致离差和正态离差之后，下一个重要的随机量 是指数离差。 
这样的数出现于“到达时间”情况中。例如，如果一个放射体以某种速度放出 a 粒 
子，它平均每"秒钟放出一个粒子，则在两次连续的放射之间的时间有指数分布且 

均值为这个分布由公式 

Fix ) = 1 - e _ 々， (31) 


定义 


o 


1) 对数方法。 显然，如果 : y 


F ( 


X 




F 


- 1 


( y ) — - ^ ln ( 1 


30。因此由等式 （7)，_" ln ( l - LO 有指数分布。由于当 U 是一致分布时 ， I - U 


也是一致分布，我们的结论是 


X 




In U 


(32) 


是均值为^的指数分布。 


0的情况必须特别地处理，我们可以以任何方便的 


值6代替0,因为这个情况的概率是极其小的。） 

2) 随机极小化方法。 在算法 F 中，我们看到有一些计算一致离差的对数的简单 

而快速的方法。下边特别有效的方法是由 G . Marsaglia ， Sibuya 和 J . H . Ahrens 建立 
的[见 CACM 15 (1972),876-877]： 


算法 S (具有均值"的指数分布） 使用具有 （ 〖+ 1) 个二进位精度的一致离差， 
本算法在一台二进计算机上产生指数离差。常数 



(33) 


应预先算出，展开直到 Q [々]> l -2-/ 为止。 

S1. [得到 L 7 和移位]生成一个 U + 1) 位一致随机二进分数 U = (■ bj 2 … 
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匕) 2; 找出头一个0位~，并移走前导 j + l 位，置 U —(. b J +1 〜 b t ) 2 。 (像在 

算法 F 中一样，被拋弃的二进位的平均个数为2。） 

52 . [立即接受？]如果 L/<hi2, 置 In 2+ L7) 并结束此算法（注意 Q 

[l] = in2) 0 

53. [极小值]求使得 L/< Q[ A] 的最小的大于等于 2 的々 ，生成々个新的一致 
离差 R ，…， R ， 并置 

54. [派送答案]置 X—"G+V)ln2 。 ■ 


生成指数离差也可使用另一些方法（例如，如同在算法 R 中的一致的比例方 

法 ）o 


E . 其它连续分布 

某些其它分布。 


现在我们简略地考虑如何处理在实践中相当经常地出现的 


1) 阶 a > 0 的伽玛分布由 



定义。当 a 二1时，这是具有均值1的指数 分布； 当。=|时，它是^2 2 的分布，其 

中 Z 有正态分布（均值0,方差1)。如果 X 和 Y 分别是阶为 a 和6的独立伽玛分布 
随机变量，则 X + Y 有阶为 a + 6 的伽玛分布。于是，例如，具有均值1的 々个 独立 
指数离差之和有阶为 A 的伽玛分布。如使用对数方法 （32) 来生成这些指数离差，则 
我们仅仅需要计算一个 对数： X ^- lniU , … R ) ，其中 LA ，…， R 是非零一致离 

差。这一技术处理所有的整数阶 a ; 为完成这个描述，对于 0< a < l 的一个适当方 
法，可在习题16中找到。 

当 a 很大时，简单的对数方法太慢，因为它要求 La 」 个一致离差。而且有一个 
相当大的风险，即乘积比…将引起浮点溢岀。对于很大的 a ， 下列由 J . H . 

Ahrens 给岀的算法是相当有效的，而且很容易借助标准子程序来写[见 Am hsr . 
Star . Math . 13 (1962) ,23 卜 237] 。 


算法 A (阶 a > 1的伽玛分布） 

A 1, [生成候选者]置 Y — tar ^ TtL ；)， 其中 U 是一个一致离差，而且置 X — 

/2^1 Y + a - l 0 (代替 tanUL ；) 我们可以使用一个配极方法，如同在算 
法 P 的步骤 P4 中那样计算比值 V 2 /V 10 ) 

A 2 .[接受？]若 X <0, 则返回 A 1。 否则生成一个一致离差 V ,并且若 V >(1 

+ Y 2 )exp( (a — l ) in ( X/(<2 — 1)) _ \/ 2 a ~ 1 Y) 就返回 A1 。 否则接受 X 。 

I 


当 a >3 时，步骤 A 1 被执行的平均次数小于1.902。 

基于以下值得注意的事实，即伽玛离差近似地等于 aX 3 , 其中 X 是有均值1 - 
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3.4 其它类型的随机量 


l /(9 a ) 和标准差 l / W 的正态分布，对于很大的 a ， 也有一个吸引人的 方法； 请见 

E . B . WUson 和 ] VL M . Hilferty , Proc . Nat . Acad . Sci . 17 ( 1931 ), 684 〜 688; G . 
Marsaglia , Computers and Math . 3 (1977) ,321 〜325。 ” 

关于稍微复杂点但要快得多的算法，请见 J . H . Ahrens 和 V . Dieter 的论文， 
CACM 25 (1982)，47〜54。这个算法生成伽玛离差的速度大约是生成正态离差的 
两倍。这篇论文包含了用于构造这个算法的设计原理的有启发性的讨论。 

2) 带有正参数 a 和6的贝塔分布由 

F ( x ) = Y ( a ) T ( b )\ l ta ~' (1 - 。卜 1 di ， (35) 

定义。令 & 和 X 2 分别为阶 a 和阶6的独立的伽玛离差，并置 X — X 1 /( X 1 + X 2 ) 0 
另一个对于小的 a 和6有用的方法，是反复地置 (7 少和 Y 2 — U \ lb 直到 A + 


y 2 <l 为止； 然后 Y l + Y 2 ) [见 M . D . Johnk , Metnka 8 (1964) ， 5 〜 15 ] 。 

如果 a 和6是整数（不太大），则还有另外一个方法，即置 X 成为 a + 6-1 个独立一 
致离差中的第6个最大者（参考第5章开始的习题9)。也见 R . C . HXheng 所描述 
的直接方法 ， CACM 21(1978),317 〜322。 


3) 具有 v 个自由 度的？ 分布（等式 3.3.1- (22)) 是通过置 X —2 Y 得到的，其 


中 Y 是阶为 W 2 的伽玛分布。 

4) 自由度为^和 v 2 的 F 分布（方差比分布）由 


FU ) 




12 


+ v 2 )H) 


T(vj2)nv 2 l2) 


/ 2-1 



(36) 


所定义，其中： c>0。 设 A 和是独立的且其自由度分别为&和 v 2 的；^ 分布， 
置 X — 。或者置 X ^^ Yl ^ d - y)， 其中 Y 是具有参数 h /2 和“/2的 
贝塔变量。 

5) 具有 w 个自由度的 z 分布是由 

FU ) = r ( 2+ 丄)/2) 「 (1 + t 2 hy {v + {)n dt (37) 

vttw r ( y/2 ) 」 - 

定义的。设 A 是一个正态离差（均值0,方差1 )，并设是与 h 无关，并有^个 


自由度的 X 2 分布； 置 X — 或者当 W >2 时，设 L 是一个正态离差并设 
y 2 独立地有均值 2/( V -2) 的指数 分布； 置 Z —-2) 并且如果 e ~ Y 2 T 2 >1 - 


乙就拒绝^， Y 2 )， 否则置 X <- y i / x /( l -2/ y )( l - Z ) 0 后一方法是 G . Marsaglia 

给出的，见 Math . Comp . 34 ( 1980) ，235 〜 236。[也见 A . J . Kinderman，J . F . Mona ¬ 
han 和 J . G . Ramage ， Math . Comp . 31 (1977) ， 1009 〜 1018。] 

6) 半径为 1 的 72 维球体上的随机点。设 X 1 , X 2 ,-*, X „ 是独立的正态离差（均 

值0,方差 1) ，在这单位球上所寻求的点是 


-在323页上的算法中，把“ + (3^-1)” 改成“-(3^-1)”。——原注 
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( X ' lr ， X 2 lr ， …， X „ lr )， 其中厂二 V X ? + X 蓋 + …+ X : (38) 

如果利用配极方法，即算法 P ， 计算诸 X ，我们每次计算两个独立的 X ，而且在 
该算法的记号下，有幻十 -2 In S ; 这就节省了一点为计算 r 所需要的时间。 

(38) 的正确性是从这样一个事实得来的，即点 （ Xi ，…， X „) 的分布函数的密度仅仅 
依赖于它和原点的距离，所以当把它投影到单位球上时，它有一致分布。这个方法 

首先是由 G . W . Brown 提岀的，见 Modern Mathematics for the Engineer ， 第 1 辑， E . 
F . Beckenbach 编辑 （New York : McGraw - Hill , 1956) f 302 0 为得到在 n 维球内的 一 
个随机点， R . P . Brent 提出取曲面上的一点，并把它乘以 U * 。 

在三维中，可以使用一个简单得多的方法，因为每个个别的坐标在 - 1和+ 1之 
间一致分 布：通 过算法 P 的步骤 P 1 〜 P 3 找到 Vi ， V 2 和 S ， 则所求的球面上的随机 

点是（。\^ 1 ，。\^ 2 ,25 _ 1)，其中0： = 2 \/1 - S 。 [ Robert . E . Knop,CACM 13 (1970) ， 

326 0 ] 

F. 重要的整值分布 仅由整值组成的一个概率分布实质上可由本小节开始时 
所描述的技术来加以处理;但这些分布中有些在实践中十分重要，因此值得在这里 
特别提及。 

1) 几何分布。 如果某个事件以概率出现，则这一事件的出现之间（或直到这 

一事件头一次出现之前）所需的独立试验数 N 有几何分布。我们有 N =1 的概率 

是 p ， N 二2 的概率是 （1- p 、 p ， …， 的概率是 （1 _ p Q 这实质上是 

3.3. 2小节的间隔检验中已经考虑过的 状况； 它也直接同这小节的算法的某些循环 

被执行的次数有关，例如配极方法步骤 P 1 〜 P 3 的执行次数。 

生成具有这种分布的 一 个变量的 一 个方便方法是置 

N — [In U I ln(l - p)l (39) 

为校验这一公式，我们发现 「ln L 7/ ln ( l -/0>72, 当且仅当 n - 1 < In U / ln(l - 

fXnJPd - prMSL / Xl - 而这发生的概率如同我们要求的那样，为 

户（1->)” _1 。量111 L 7 可以任意地以- Y 代替，其中 Y 有均值为1的指数分布。 

= |的特硃情况在一台二进计算机上可以非常简单地处理，因为公式 （39) 简 

化成置 iV—「-ig LH ; 即 N 比 L 7 的二进制表示中的前导0位个数大1。 

2) 二 项分布 （〖，^)。如果某个事件以概率出现，且我们进行 z 次独立的试 

验，则事件出现的总数 ] V 等于 n 的概率为（见 1.2.10 小节）。换 

言之，如果我们生成，…， L /,， 我们要计算这些当中有多少小于 f 。 对于小的 h 
以这方式恰能得到 iV 。 

对于很大的〖，我们可以以整参数 a 和6生成一个贝塔变量 X ，其中 a + 6- l 二 
G 这样可以有效地给出〖个元素的第6个最大者，省去了生成其它元素的麻烦。现 
在如果，我们就置其中 iVi 有二项分布 U - i ，/>/ x )， 因为这告诉我 


们在范围 [ o ， x ) 中的 a -1 个随机数中有多少是小于 P 的； 而如果 X < p ， 我们就置 
N^-a + N : ，其中 Nt 有二项分布 （6 - l，（p - X)/(l - X ))，因为 Ni 告诉我们在 

[ X ， l ) 的范围内的 6-1 个随机数中有多少小于 P 。 通过选择 a = l + Lr /2」， 在大约 
lg t 次这类约简之后，参数 i 将被减少到相当的大小。（这一方法是由 J . H . Ahrens 
给出的，他还提出对于中等大小的 z 的一个替换方案，见习题27。） 

3) 具有均值 a 的泊 松分布 这个分布同指数分布有关，就如二项分布同几何分 
布有关 一样： 它表示在任何时刻都可能出现的一个事件在每个单位时间里出现的次 
数。例如，在一秒钟的时间里，由放射体放出的 a 粒子的个数是一个泊松分布。 

根据这一原理，我们可以首先生成具有均值的独立指数离差；^，又 2 ，…，而 

且 一 旦& + … + X m ^ l 即停止;然后令1 ， 即得到 一 个泊松离差 。 A + … + 

X m > l 的概率是阶为 m 的一个伽玛离差>"的概率，亦即 .f : _ 
1)!; 因此 N = n 的概率是 

1 poo 1 广 oo n 

—r fe 一 Mr - 7 ~~ L TTT f 一 1 e—，ck 二 e—n > 0 (40) 

n 1 J ^ n ! 

如果我们通过对数方法生成指数离差，则上面的方法告诉我们当 -(In LA + … + 

In U m ) l ^> l 时停止。简化这个表达式，即可看到通过计算 e 〃，把它换成定点表 

示，然后生成一个或多个一致离差 ，…直 到乘积满足最后置 

JV—m -1，即得到所需的泊松离差。平均来说，这要求生成1个一致离差，所以 
当"不太大时，它是非常有用的方法。 

我们知道如何处理很大阶的伽玛分布和二项式分布，利用这一点，当"很大时 
我们可以得到阶为 log ^ 的一个方法。首先生成 X ，它具有阶 m = L 叩」的伽玛分 
布，其中 a 是一个适当的常数。（因为 X 等价于-111(1/广_1^)，我们实质上绕过了 

前面方法中的 m 步。）如果，则置 N — m + ，其中 Ni 是具有均值 " - X 的 

一 个泊松 离差； 如果则置 N — %，其中乂有二项分布 ~ l , julX ) o 这个 

方法是由 J . H . Ahrens 和 U . Dieter 给出的，他们的实验说明，7/8是对 a 的一个好的 
选择。 

当 X > ju 时，上述约简的正确性是下列重要原理的一个推论 ：“设 ，…，是 
具有相同均值的独立指数 离差； 对于设 = A + … +&，且设 V】： Sjl 
。则 V ^，\/ 2 ，…，的分布和排成递增次序的 m -1 个独立的一致离差的分 
布一样，为了形式地建立这个原理，给定 S nl = S 的值，我们对任意的值 

， 计算 V 1 ^ T ； 1 ? ^ \ ^ v 7)} - 1 的概率：设 /( ， … ， 、 — 1 ) 是 m ~ I 

重积分 
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贝 I ]通过替换 ，1 =似1， ，1 + O =似2 ，…， h … L -1 =1 ’有 


/(以1,力2,‘.. > ^ m ~\) 

~ /(1,1,-*TT) ~~ 



后边的比是在条件下 ，一 致离差 L 7: ，…， 〜_ r 满足 ，…， 
Uf 的对应概率。 

习题22概述了一项更有效的但稍微更复杂的关于二项式和泊松离差的技术。 

G . 更多文献 1947年5月21 日 , John von Neumann 所写的一封信的传真，出 
现在 Los Alamos Science 特刊 Stanislaw Ulam 1909 - 1984 上 （Los Alamos National 

Lab . ,1987),135- 136 o 就在这封信中，拒绝方法问世。由 L Devroye 所写的书 

Non-Uniform Random Variate Generation ( Springer ，1986) 讨论了更多的有不一致分 

布的随机变量的生成算法，以及每种技术在典型计算机上的有效性的详细研究。 

W . H 6 rmann 和 G . Derflinger [ACM Trans . Math . Software 19 (1993) ， 489 〜 

495] 指出，在同有小的乘数 a 〜的线性同余生成程序相关联时，使用拒绝方法 
可能是危险的。 

从理论观点来看，在使用可能的最小个数的随机二进位产生所要求的结果这一 
意义下，考虑生成具有给定分布的随变量的最优方法，是有益的。关于处理这样一 
些问题的一个理论的雏形，请见 D . E . Knuth 和 A . C . Yao 著， LF . Traub 编辑， Aigo - 
rithms and Complexity (New York：Academic Press , 1976) ,357~428 0 

作为对本小节许多技术的复习，推荐做一做习题16。 


习题 

1. [10]如果 a 和/?是实数，且 a <广你将如何生成在 a 和/3之间一致分布的一个随机实数？ 

2 . [ M 16 ] 假定 ml / 是0和 m - l 之间的一个随机整数，如果 0< r < A ， 问 r 的精确概 

率是什么？把这同期望的概率1/々进行比较。 

► 3.[ i 4] 如果把 U 当做一个整数并计算其模々剩余，以得到0和々-1之间的一个随机整数， 
而不是像正文中所建议那样做乘法。这样 （1) 将变为 

ENTA 0 
LDX U 
DIV K 

且结果出现于寄存器 X 中。这是一个好方法吗？ 

4. [ M 20] 证明 （8) 中的两个关系。 

► 5. [21] 提出一个有效方法计算具有分布批+弘 2 + rx 3 的一个随机变量，其中 p > 0 , g > 0 , 


r ^ O 且 />+(?+广 = 1。 

6. LHM 21] 通过下列方法来计箅量 X : 
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步骤 1. 生成两个独立一致离差 L ； 和 V 。 

步骤 2. 如果 U 2 + V 2 >1， 则返回步骤1，否则置 X — U 。 

什么是 X 的分布函数？步骤1将被执行多少次？（给出均值和标准差。） 

卜7 . [20 ] ( A . J . Walker ) 假设我们有一■堆々种不同颜色的 AL 方体，比方说，对于々，有~ 

个颜色 q 的立方体，同时还有々个盒子，…，，它们每个恰可装7?个立方体。而且” i +… 

+ n k = kn ，所以这些立方体正好装得进这些盒子中。试（构造性地）证明总有一个方法来把这些 

立方体放进这些盒子中，使得每个盒子中最多有两种不同颜色；事实上，存在一种办法使得每当 
盒子含两个颜色时，颜色之一为 C ,。 给定一个概率分布 （ R ，…，九），说明如何使用这个原理 


来计算 （3) 中所需求的 P 和 Y 表。 

8.[ M 15] 证明 ：运算 （3) 可以改为运算 


如果 L 7< P K ， 则 X — x K +1 ，否则 X 


y 


K 


(即用 U 原来的值代替 V )，如果通过适当更改，…，能更方便地实现后者的话。 

9.[ HMJ 0] 为什么对于工<1，图9的曲线 /(: c ) 向下凹，而对于 工>1 却向上凸？ 

► 10. [ HM 24] 说明怎样计算辅助常数尸,，0,，7,，4,5 ; ，9，乓，使得算法]^提供具有正确分 


布的答案。 

► 11. [ HM 27] 证明算法 M 的步骤 M 7- M 8 生成一个随机变量，它具有正态分布的适当尾形; 
换句话说，的概率应精确地为 






x ^ 3 


[提 示： 证明它是拒绝方法对于某个 c ， 满足 g(0 = Q e - ; 2 / 2 的一个特殊情况。] 

12. [ HM 2 3 ]( R . P . Brent ) 证明 （ 23 ) 中定义的数 4 满足关系 aj - aj .^2 In 2( 对于所有 


1)。[提 示：若 f { x ) = ^ n I >1 2/2 心，证明对于0<工<1/(工）>/(30。] 

13. [ HM 25 ] 给定一组”个独立正态离差，且均值为0和方差为1，试说明如何 
求常数~和，使得如果 

L = 心 1 十 anX*" 丫 2 二心 2 十 a 2l 1 ■*" a 22^2 y'" ~ ^ a n\^ I + . + a nn^Ti 

则 y t , y 2 , 是相关正态分布变量有均值内，且诸 y 有一给定的协方差矩阵（~)。（\ 
和 的协方差〜定义为 （ Y ,.- 内 ）（K _〜）的平均值。特别是， C 力是 K 的方差，即它的标准差的 
平方。并非所有矩阵（~)都可以是协方差矩阵，因而每当对于给定条件可能存在一个解时，你的 

构造才能有效。） 

14. [ M 2]] 如果 X 是具有连续分布 FU ) 的一个随机变量，而且如果 c 是一个（可能为负的） 
常数，问 cX 的分布是什么？ 

15. [ HM 21 ] 如果&和 X 2 是分别具有分布 Fjx ) 和 F 2 (: c ) ，且具有密度 fi ( x ) = F \( x ), 

f 2 { oc ) = FUx ) 的独立随机变量，量 X ! + X 2 的分布和密度函数是什么？ 

► 16. [ HM 22 ]( J . H . Ahrens ) 利用当0< i <1 时为 eg ( t ) = t °~ l lr ( a ), 当，时为 cg ( Z ) = 

e _ VrU ) 的拒绝方法建立求阶为 a (当 0< a < l 时）的伽玛离差的一个算法。 

► 17. [ M 24] 什么是具有概率/>的几何分布的分 布函数 FU )? 什 么是生 成函数 GU )? 什么 

是这个分布的均值和标准差？ 

18. [ M 24] 提出一个方法来计算一个随机整数 N ， 对于这一方法而言， N 以” p 2 x ( l - p)”M 

U >0) 的概率取值 72。 （特别有趣的情况是当 P 比较小时。） 
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19. [22] 负的二 项分布 （〖，/>)有整数值 / V =?2 的概率为 P — 1 + 7 Z V (1- p )% (不像通常的 

\ n I 

二项分布， z 不必是一个整数，因为当/>0时，这个量对所有〃都是非负的）。推广习题18,说明 
当^是小的正整数时，如何生成具有这个分布的整数 N 。 如果/ = /> = +，你将提出什么方法？ 

20 . [ M 20 ] 设 A 是图13中的阴影区域内的面积，并设尺是包含它的矩形的面积。设 I 是为 
步骤 R 2 所接受的内部区域的面积，而£：是在步骤 R 3 拒绝的外部区域和外部矩形之间的面积。 
借助于 A ，只，/和£，试如 （25) 中那样对于它的四个变形的每一个，确定算法 R 的每步被执行的 
次数。 

21. [ HM 29] 导出计箅习题20中定义的 M A ， 尺， J 和£的公式（对于/以及特别是£，你可以 
使用一个交互的计算机代数系统）。说明对于形如 “ X 2 <4 (l + ln c ) _4 cL 7” 的测试 ， c = e 1/4 是在步 
骤 R 2 中最好的常数。 

22 . [ HM 40 ] 通过生成一个适当的正态离差，以某种方便的方式把它转换成一个整数，并偶尔 
应用一个（可能很复杂的）修正，问能够得到对于很大的^的精确泊松分布吗？ 

23. [ HM 23]( J.von Neumann ) 下面两个生成随机量 X 的方法是等价的吗（即 M X 是否有同 

样的分布）？ 

方法1:置 X — sin ( U /2) LO , 其中 U 是一致的。 

方法2:生成两个一致离差 L 7 和 V ，而且如果 U 2 + V 2 >1， 则重复执行，直到 U 2 + V 2 <1 0 

然后置 X — | U 2 - V 2 \ KU 2 + V 2 ) 0 

24. [ HM 40]( S . Ulam , J.von Neumann ) 设是在0和1之间随机选择的一个实数，通过规 
则 V w + 1 =4 V n ( l - V „) 定义序列〈 V ,,〉。如果以完全的精度来进行这个计算，则其结果将是具有 

分布 S m 2 Trl 7 的一个序列，其中17是一致的，即具有分布函数 F ( x)^\ X Q dxj V 2 nx ( l - a :) o 因 

为如果我们令 = 即知 U n + l = (2 U „) mod 1，而且因为几乎所有的实数都有一个随机 

的二进展开（见 3.5 节），所以序列 L 7„ 是等分布的。但如果的计算仅以有限精度进行，则上述 

论证就失败了，因为我们很快就受到舍入误差的干扰 [von Neumann , Collected Works 5,768 — 

770 ] 0 

当仅给出有限精度时，试从经验上（对于的各种不同选择）和从理论上分析上段定义的序 
列〈 V ,,〉。这一序列是否有类似于预期的分布那样的分布？ 

25. [ M 25] - S ： 是二进字，它们的每一个二进位都独立地 以+的 概率为0或1。 

问什么是 AVdAUJ U 4 AX 5 ))) 的一给定位位置含1的概率？试推广之。 

26. [ M 18] 设％和 N 2 是分别有均值仏和的独立的泊松离差，其中&>^ 2 >0。证明或 
否定心)％ + 乂有均值 A + & 的泊松分布。的泊松分布。 

27. [22 ]( J . H . Ahrens ) 在大多数二进计算机上，有一个有效的方法来计箅一个二进字中1的 
个数（参见 7.1 节）。因此当0 = 1/2时，有一个很好的方法来得到二项分布只须生成^个 
随机二进位并计算1的个数就行。 

试设计对于 任意的 p 产生二项分布 j ) 的一个算法，仅仅使用对于 p = ll 2 的特殊情况的 
一 个子程序作为随机数据源。[提 示： 模拟一个过程，该过程首先观察 r 个一致离差的最高有效 
位，然后观察其前导的二进位不足于确定它们的值是否小于 p 的那些离差中的第二个二进位，等 
等 J 

28. [ HM 35]( R . P . Brent ) 试建立一个方法生成由2 =1定义的椭圆体曲面上的一个随 
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机点，其中 — 

29. [ M20 ]( J . L . Bende y * J . B . Sa Xe ) 试找出生成在0和1之间一致的打个数 X ! ，…， X ”的 
一个简单方法，但不要求它们是排了序的，即 Xi < …这个事实，你的算法应当只花费◦“） 

步 o 

30. [ M 30] 解释如何生成随机点（\， K ) 集，使得如果 K 是单位方阵中包含的任何面积为《 

的矩形 ，则只 中的（'.， Y ; ) 数有均值％的泊松分布。 

31. [ HM 3 9] (正 态离差的直接生成） 

a ) 证明如果以+…+ a 〗 =1 且如果 X } ，-, X ,是有均值0 和方差1的独立正态离差，则 
+…+ a k X k 是有均值0和方差1的正态离差。 

b ) a ) 的结果提示，如同我们从老的一致离差能得到新的一致离差一样，我们能从老的正态离 
差得到新的正态离差。例如，在一组正态离差：^，...，乂 54 已初始地被计算之后，我们可以使用 3. 

2.2-(7) 的思想，但通过像下面这样的一个递推式： 

3 4 

X n — ( X „_24 + X „_55 ) / V2 或 X n = 了 尤_24 + 了乂„-55 


试说明为什么这不是 一个好想法。 

c ) 然而，试说明，有一个适当的方法，通过使用 a ) 和 b ) 中的思想的一个改进，可以从其它的正 
态离差迅速地生成正态离差。[提示 ：如果 X 和 y 是独立正态离差，则对于任何角度 d i x , = 

X cos 沒 + y sin 沒以及 y ' = - X sin ^ + y cos d 也是。] 

32. [HM30](C.S.Wallace) 设 X 和 Y 是具有均值 1 的独立指数离差。试证明，如果以下列任 
何方式从 x 和 y 得到叉/和 y 、 则类似地:^和 y / 是具有均值1的独立指数离差 _• 

a ) 给定 0< A <1， 

x^d -a )x -ay + (x+ y)[(i -a )x< ay], = x + y — t 

KWr VI l (2X ， Y — X) ， 如果 X<y 

bM ’ l (2 Y , x - V ), 如果 X>Y 

c) 如果在二进记号下 ， X = : 一 2 ： r _3 … ） 2 和 y = (--yiyxy^- y-vy-iy-^ 


參 ft 


) 2 ，则： r 和 r 有“洗过了”的值 




(… 义 … 工。 ■: w— 2》-3… ） 2 和 ’ 


(…: y2 工 i ： yo ♦工 -i：y - 2W ‘） 


2 


33. [20] 通过消耗未知其个数的一致随机变量…，算法 P ， M ， F 和 R 生成正态离差， 
如何能修改它们使得输出仅是一个 U 的函数？ 


3.4.2 随机抽样和洗牌 

许多数据处理应用都要求从含有以个记录的一个文件中随机地无偏倚地选择 
72个记录。例如，这个问题出现于需要有抽样的质量控制或其它统计计算中。通常 
IV 非常大，以致不可能一次在存储器中存下所有数据；而且个别的^录本身通常也 
非常大，因此我们甚至不可能在内存中容下〃个记录。因而我们要寻求一个有效的 
选择 n 个记录的过程，通过这一过程，当每个记录到来时，判断是接受还是拒绝它， 

并把所接受的记录写到一个输出文 件上。 

对于这个问题已经想出了许多方法。最明显的方法是以概率 nlN 来选择每个 

记录； 这有时可能是合适的，但它仅仅能使抽样中的记录个 数平均 为”。标准差是 
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7 n(l _ tz / N )， 而且样本可能或者对于我们所希望的应用来说太大，或者对于给出 
必需的结果来说又太小了。 

幸而，只需对这个“显然”的过程做一简单的修正即可给出所需要的结果：如果 
已经选择了 m 个项目，则对第 i 十1个记录应以概率 U _ m)/(N - 0加以选择。 
这是适当的概率，因为在从 N 个事物中选择 n 个并使 m 个值出现在头 （ 个当中的 
所有可能的方式中恰有 

^ N — t — 1 \ H N — t 、— n — m ( 1 ) 

\n — m — I // \n — ml N — t 

种方式选择第 1 个元素。 

在上一段中提出的思想立即引出了下列算法： 

算法 S (选择抽样技术） 从 N 个记录的一个集合中随机地选择72个记录，其中 

0< 72< No 

5 1. [初始化]置0， m — 0。（在本算法中， m 表示已选得的记录数，而^表 

示我们已经处理过的输入记录的总数。） 

5 2. [生成 （7] 生成在0与1之间一致地分布的一个随机数17。 

S 3 •[检验]如果 （ iV - _ m ， 则转到步骤 S 5。 

5 4 . [选择]把下一个记录选为样本， m 和 Z 加1。如果 m < 则转到步骤 
S 2; 否则取样完成，算法终止。 

5 5. [跳]跳过下一个记录（不把它选为样本） “加 1，并转到步骤 S 2 。 I 

乍一看，这个算法可能显得不可靠而且简直是不正确的；但经过细心的分析(见 

下面的习题），证明它是完全信赖的。不难 验证： 

a ) 至多输入 iV 个记录（在选择 rz 个项目之前，我们绝不会跑出文件的末尾）。 

b ) 这个抽样是完全无偏 倚的； 特别是，任何给定的元素（例如文件的最后元素） 
被选择的概率是 nlN 。 

虽然有这样的事 实：即 我们不以概率 WN ， 而是以等式 （1) 中的概率选择 第/十 
1项，但命题 b ) 是真的！这在发表的著作中引起了某些混乱。读者能否说明这种表 
面上的矛盾？ 

(注 ：当使 用算法 S 时，每次运行程序时，都应该小心使用随机数 U 的不同来 
源，以消除不同时候得到的抽样之间的联系。例如，这可以通过每次使用线性同余 
方法选择不同的 Xo 值来实现。种子值可以赋值为当前的日期，或者赋值成上 

次运行该程序时生成的最后的 X 值。） 

我们通常将不扫描所有个 记录； 事实上，因为上边的 b ) 指出最后的记录是以 
概率 〃/ iV 被选择的，故在恰考虑最后记录 （1- n / iV ) 时机之前，就已终止这个算法 

了。当 n =2时所考虑的记录平均数大约是 | n ， 习题5和6给出了一般的公式。 

C . T . Fan，Mervin E . Muller 和 Ivan Rezucha 在 一 篇文章中讨论了算法 S 和一些 

其它的抽样技术，见 J . Amer . Stat . Assoc . 57(1962) ，387 〜 402。这个方法独立地为 
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T.G Jones 所发现，见 CACM 5 (1962),343 。 

如果我们预先不知道 N 的值，就出现问题了，因为在算法 S 中 N 的准确值是 
至关紧要的。假设我们要从一个文件中随机选择”项，但不知道在该文件中恰有多 
少项，我们可以首先扫描并计算这些记录，然后用第二遍扫描来选择它们；但是一般 
来说更好的是在第一遍扫描时就抽取个原始项目，其中 m 比 N 小得多，所 
以在第二遍扫描时仅需考虑 w 项。当然，以这样一种途径来做这项工作的技巧是， 

要使最后的结果是原始文件的一个真正随机的抽样。 

因为我们不知道输人何时结束，故必须记住迄今所看到的输人记录的一个随机 

抽样，这样随时都可以结束。当读输入时，我们将构造 w 个记录的一个“水库”（储 

蓄器），这个水库只含在前边的抽样中已出现过的记录 。头〃 个记录总是进入水库 

中。当输入第〖十1个记录而 t > n 时，我们将在内存中有 n 个索引的一张表，它们 

指向水库中属于我们从头 i 个记录中已经选定为随机抽样的那些记录。问题就成 

了当 r 增1时仍要维持这一状态，就是说从现在已知存在的1个记录当中选择 

一个新的随机抽样。不难看出，我们应当以 n /(〖 + 1) 的概率来把新记录包括到新 

抽样当中，而且在这种情况下，应该去掉以前抽样中的一个随机元素。 

因此，下列过程完成这一工作。 

算法 R (水库抽样） 给定 n >0,从其确切大小未知但大于等于”的一个文件 
中随机选择〃个记录。一个称做“水库”的辅助文件存放有作为最后抽样的候选者 
的所有记录。本算法使用具有不同索引的一张表，其中每一个索引 

指向水库的一个记录。 

R 1. [初始化]输入头 n 个记录，并把它们复制到水库中。对于置 

并置 t — m — (如果被抽样文件少于”个记录，当然有必要中 

断算法并报告失败。在算法运行期间，索引1[1]，…， /[ W ] 指向当前抽样 
中的记录； m 是水库的大小；而〖是迄今已处理过的输入记录数。） 

R 2 [文件结束？]如果已无记录输人，则转到步骤 R 6。 

R 3 .[生成并检验] r 增1，然后生成1和 〆 含0之间的一个随机整数 M 。 如 

果 M> 72, 则转到 R5 。 

R 4 .[加到水库中]复制输入文件的下一记录到水库中，讲增1并置 — 

m 。 (以前由 J [ M ] 指示的记录现在在抽样中为新的记录所代替。）转到 

R 2 0 

R 5. [跳]跳过输入文件的下一记录（不把它包括在水库中），并返回步骤 R 2。 
R 6. [第二次扫描]对 J 表的项进行排序使得1[1] <…然后扫描水 

库，并把具有这些索引的记录复制到保存最后抽样的输出文件中。 ■ 

算法 R 是由 Alan G.Waterman 给出的，读者可以把习题 9 中运行该算法的例子 

做一遍。 

如果诸记录充分短，当然完全没有必要“建水库”，我们可以在所有时候都把当 
前抽样的 n 个记录存放在内存中，因而算法就变得简单得多（见习题10)。 
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关于算法 R ， 我们自然要提这样的 问题： “水库预期的大小要多大？”习题11表 
明 m 的平均值恰是72(1 + ^^-/^);这近似于 n ( l 十 ln (7 V //2))。 所以如果 Nln = 

1000,这水库将仅仅包含原来文件的大约1/125的项目。 

注意，算法 S 和 R 可用来同时得到若干独立范畴的一些抽样。例如，如果我们 
有美国居民的名字和地址的一份大文件，我们可以从50个州的每一个当中挑出恰 
有10个人的随机抽样，而不必对此文件进行50次扫描，而且不必首先按州对这文 
件进行排序。 

如果我们生成一个随机变量来告知我们自己应当跳过多少记录，而不是决定是 

否跳过每一个记录，则当 n / N 很小时，对算法 S 和算法 R 两者的重大改进是有可能 
的（请见习题8)。 

按照从 iV 个事物中每次取72个加以组合的通常定义（见 1.2.6 小节），抽样问 

题可以认为是进行一个随机 组合的 计算。现在我们考虑计算 i 个对象的一个随机 

排列的 问题; 我们把这称为洗牌问题，因为洗一副牌，无非是对它进行一次随机的排 
列。 

稍加思索就能使任何玩牌者认识到，传统地用来洗牌的一些方法是极不适当 

的；通过这样的方法根本不能在任何地方都以近乎相等的概率得到个排列的每一 

个。据说老练的桥牌行家在决定是否“叫”牌时便利用这一事实。为了达到10%以 

内的一致分布，对 52 张的一副牌至少需要洗 7 次，而 14 次随机的洗牌可保证之[见 
Aldous 和 Diaconis , AMM 93( 1986) ，333 〜 348] 。 

如果 i 很小，我们可以通过在1与之间生成一个随机整数非常迅速地得到一 
个随机排列。例如，当 t =4 时，在1与24之间的一个随机数足以从包含所有可能 
的排列的一张表中选择一个随机排列。但是对很大的 I 如果我们要声言每个排列 
是同样可能的，就有必要更仔细些，因为 r ! 比个别的随机数的精度要大得多。 

一 个适当的洗牌过程可以通过回想算法 3.3.2 P 来得到，它给出 H 个可能的 
排列的每一个排列同一个序列 （ q ， c 2 , …，^-^之间的简单对应，这里随 

机地计算这样一组数是很容易的，因而我们可以使用这个对应来产生一个随机排 
列。 

算法 p (洗牌）设 x 1 , x 2 ,*--, x / 是要洗的〖个数的一个集合。 

P 1 ■[初始化] 置 j — t 0 

P 2. [生成 [7] 生成在0与1之间一致分布的随机数/7。 

P 3 •[交换]置 LjL /」+ l 。 （现在々是1与 j •之间 的一个随机整数。习题 
3.4.1- 3说明不应取模 j 剩余以计算々。）交换 XpX 】。 

P 4 .[减小 j ] ，减 1。如果 j >1，则返回步骤 P 2。■ 

这个算法首先是由 R . A . Fisher 和 F . Yates 以普通语言发表的 [Statistical Tables 
( London , 1938) ，例 12]，而由 R . Durstenfeld 以计算机语言发表 [CACM 7 ( 1964 ) ， 
420] 。如果我们只想生成 1 1，…， d 的一个随机排列而不是洗一个给定的序列，…， 
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X )，我们可以通过令 ； 由1增加到，并置4—不，来避免交换操 作&一 x ;; 

见 D . E . Knuth ， T 7 ie Stanford GraphBase (New York : ACM Press , 1994) ，104。 

R . Salfi[COMPSTAT 1974 ( Vnenna : 1974) ,28 〜 35] 已经指出，当我们以模 m 
的一个线性同余序列得到一致的 U 时，算法 P 可能不能生成多于 m 个的不同排 
列，也就是说其实当我们使用一个递推 L /„ + 1 = /( K ) 时，对于它 K 仅可取 m 个不 

同的值，因为在这样的情况下最后的排列完全由被生成的头一个 L 7 的值所确定。 
因此，例如，如果 m =2 32 , 则13个元素的某些排列将不会出现，因为 13! 〜 1.45 x 
2 32 。在大多数应用中，我们并不真正要看到所有13!的 排列； 但是知道被排除的排 

列是由像一个格结构这样相当简单的数学规则确定的，却是令人不安的（请见 
3.3.4 小节）。 

当我们使用像 3.2.2-(7) 那样具有充分长周期的延搁斐波那契生成程序时，不 
出现这个问题。但即使使用这样一些方法，我们也不能一致地得到所有的排列，除 
非我们能够确定至少〖!个不同初始值来初始化这个生成程序。换句话说，除非我们 
把 lg 个真正随机二进位放进去，否则就得不出 lg 〖!个真正随机的二进位。 3.5 节 
说明，我们不必对此感到绝望。 

可以很容易地修改算法 P 来产生一个随机组合的随机排列（见习题15)。关于 
其它类型的随机组合对象（例如分划）的讨论，请见 7.2 节和/或 Nijenhuis 和 Wilf 的 

书 Combinatorial Algorithms (New York ： Academic Press ，1975 ) D 

习题 


解释等式 （1)。 

2. [20] 证明算法 S 绝不试图去读它的输入文件的 N 个以上的记录。 

► 3. [22] 算法 S 中的第（+1项以概率（；2-772)/(/^-£)而不是以 n / N 被选择，但正文中断言 
这个抽样是无偏倚的 ，所 以每项都应以 相同的 概率被选择！这两个命题怎么能同时为真？ 

4.[ M 23] 设是在选择抽样技术中从头 z 项当中恰巧选择项的概率。由算法 S 直 
接证明： 



对于0< 〖< N 


5.[ M 24] 当算法 S 终止时“的平均值是什么？（换句话说，在抽样完成之前，平均已经扫描 
过 n 个记录中的多少个？） 

6^[ M 24] 上题所计算的值的标准差是多少？ 


l .[ M 25] 证明，算法 S 以概率 1/( 得到由/ V 个记录的集合中取;7个记录的任何 给定的 
选择。因此这个抽样是完全无偏倚的。 

► 8. [ M 39] ( J . S . Vitter ) 算法 S 对于它处理的每个输入记录计算一个一致离差。本习题的目的 

是考虑一个更有效的方法，以便更快速地计算它在做头一个选择之前要跳过的输入记录的适当 
个数 X 。 

a ) 给定々，的概率是多少？ 

b ) 证明， a ) 的结果允许我们只须生成一个一致的 C /, 然后进行 O ( X ) 的其它计算就可计算 
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c ) 证明，我们也可以置 X — min ( y N , Yu ，…， + ，其中诸 Y 是独立的，而且在 
< t 的范围内每个 y , 是一个随机整数。 

d ) 为了获得极大速度，证明，使用等式 3.4.1-( 18) 那样的一个“挤压”方法，平均说来，也可以 
在 0(1) 步内计算 X 。 

9. [12] 设 n = 3。 如果把算法 R 应用于含有编号为1到20的20个记录的文件上，而且如果 
在步骤 R 3 中生成的随机数分别是 

4,1,6,7,5,3,5,11,11,3,7,9,3,11,4,5,4 

问哪些记录进人水库？哪些是在最后的抽样中？ 

10. [ J 5] 假定当前抽样中的 n 个记录可以放在内存中，试修改算法 R 使得能消去该水库。 

► ll .[ M 25] 设九,是在算法 R 的头一次扫描期间恰有 77 Z 个元素被存人水库的概率。试确定 

生成函数 G ( z )= 并求均值和标准差。（利用 1.2. 10小节的思想。） 

12. [ M 26] 算法 P 的主旨是任何排列 ； r 都可惟一地写成在 = … （ a 3 3)( a 2 2) 的形式下 

的置换的乘积，其中当〖巧>1时，证明也存在惟一的形如 ；r = (6 2 2)(~3)-(~)的 
一个表示，其中当 l < j < t 时，并设计在 0(/) 步内从诸 a 计算诸6的算法。 

13. [ M 23]( S . W . Golomb ) 洗牌最普遍的方法之一是尽可能地把牌分成相等的两部分，并且 
把它们“洗”到一起。（按照打牌游戏的 Hoyle 规则中玩牌规矩的讨论，“这种洗牌应当进行大约三 
次，以使这些牌彻底地搅乱”。）考虑 2 n ~\ 张卡片的一副牌 一 个“大清洗” s 把 

这些牌分成为 Xi ， X 2 , …， X ，, 和& + 1 …， An ，然后完全地相互交插它们以得到 X 1 , X „ + 1 , X 2 , 
A + “切”牌操作 d 把 '， X 2 , …， A ,, — ! 变成为 ^^，，…，^^-〖，^^，…，'。说 

明当 n > l 时，通过彻底的洗和切，顶多可能有 （2 n - l )(2 n -2) 种不同的安排。 

14. [22] 的一个切和洗排列，把它变成为这样一个序列，它包含对于某个： r 和 3 S 

相互混合的子序列 

(: z . 十 1〉 mod 7i a ( .y - 1 〉 rnod ” 和 ^ 1 ) mod n ^ ( j ：- 1) mod n 

因此， 3890145267 是对于： r = 3 和 > = 8 的0123456789的一个切和洗。 

a ) 以在标准次序 

23456789 10 JQKA23456789 10 JQKA23456789 10 JQKA23456789 10 JQKA 

+ ♦♦♦♦♦♦♦♦♦♦♦♦ 

下的52张牌开始， J . H . Quick ( —名学生）做了一次切和洗，然后他撤去最左边的一张牌并把它插 
进一个随机的位置，得到序列 

9 10KJQAKA2Q32345674895 10 6J7Q8K9 10JQAK23A423456567879 10 J8 

问他从最左边的位置移动的是哪张牌？ 

b ) 再次从这组牌原始顺序开始， Quick 现在做了 3次切和洗后把最左边的牌移动到新位置 

10 J Q 3 4 5 6 J j Q4 6KA2 3K47 5 6QA7 5A8 76KK9A 7 8 9 10 8 10 8 2 5 J 23Q49329 10 

0*4*+9*0440 A 0 A 0 V 4*0490*** 04*0^0^009049404 

问这次他动的是哪张牌？ 

► l 5.[30]( Ole - Johan - Dahl ) 在算法 P 的开始，如果对于1 < 〖，丨 = A ,而且当 j 达到/ - ； 7 的 

值时，我们终止这个算法，则序列 \_，, + 1 ，一，\是〃个元素的一个随机组合的随机排列。试说 

明如何只使用 OU ) 个内存单元模拟这个过程的效果。 

► 16. [ M 25] 基于散列 （6. 4节）的思想，给定 A / 和;7,试设计一个方法进行从 N 抽样 n 个记录 
的计算，你的算法应当使用 0(77) 个存储单元和平均 0(77) 个时间单位，而且它应当把抽样表现 
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为一个排了序的整数集合 

17. [ M 22 KR . W . Floyd ) 试证明，下列算法从 il ，…， N 1生成《个整数的一个随机抽样：置 
S — 0 ;然后对于 j — N — n 十1, N _ n + 2，…， iV (按此顺序），置 ULT 」+ 1且 

S U I 々丨， 如果々名 S 
S U i i I > 如果々 G S 


3.5 什么是随机序列 


A . 引论 在这一章中，我们已经看到了怎样生成在 0< L /„<1 范围内的实数序 
列 

( u n ) = mh ，… ⑴ 

而且我们把它们称做“随机”序列，尽管在本质上它们是完全确定的。为了说明这个 
术语是合理的，我们断言这些数的特性“很像是真正的随机数”。这个命题对于实用 
的目的（在现时）可能是令人满意的，但它回避了一个非常重要的哲学问题和理论问 
题 ：我们 所说的“随机行为”精确地说究竟指的是什么？我们需要有随机行为的定量 
的定义。谈论那些我们并不真正理解的概念是不合意的，特别是因为关于随机数会 

做出许多明显似是而非的论述。 

概率和统计的数学理论审慎地回避回答这个 问题； 它避免做绝对的陈述，只是 
对那些涉及随机事件序列的命题以它的概率有多大来表达事物。概率论公理的建 
立，使得抽象概率的计算变得容易了，但是关于概率真正意味着什么，或者这些概念 

怎样能有意义地应用于现实世界，却没有说及。 在 ProbMHty ， Statistics，and Truth 
(New York : Macmillan , 1957) — ^ 书中， R • von Mises 详细地讨论了这一'情况，而且提 

出了如下观点，即为了要给出概率的适当定义，首先要搞清楚随机序列的适当定义。 

许多作者都已对这一问题表达了他们的看法，这里我们来解释他们中的两位关 

于随机序列的论述。 


D . H . Lehmer ( 1951) : “随机序列是一个含糊的概念，它具体是指，在一^序列中， 

每一项对于非初始项来说都是不可预料的，而且它的数字通过了一定数量的检验， 

这些检验又是统计学家沿袭用的，并且与该序列的用途有关。” 

J . N . Franklin ( 1962) :“如果序列 （ 1 ) 具有这样的特点，即凡是从一■致分布的随机 

变量中独立抽样获得的每个无限序列都有的性质，它都有，则序列 （ D 是随机的。” 

Franklin 的命题实际上推广了 Lehmer 的命题，说的是这个序列必须满足所有 
的统计检验。他的定义不是完全精确的，我们以后将看到，他的命题的一个合理的 
解释会使我们得出根本就没有随机序列这样的结论来！因此我们还是从限制较少 
的 Lehmer 的论述开始，看看能否把它弄精确。实际上我们真正要的是一张相当短 
的表，即某些数学性质的一览表，我们关于随机数列的直观概念满足所有这些性质; 
而且这张表应完备到足以使我们同意，满足这些性质的任何序列都是“随机的”。在 
这一节里，我们将按照这些准则提出随机性的适当定义，尽管还有许多有趣的问题 
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有待回答。 

设 w 和是实数 ，0< w < ”<1。如果 L ； 是一个随机变量，它在0与1之间一 
致分布，则的概率等于 pi 。 例如，+<17<|•的概率是怎样才能 

够把单个数17的这个性质转换成无限序列 L / o , L 7:， U 2 , …的一个性质呢？明显的 

答案是计算％有多少次位于 w 和 d 之间，其平均次数应等于 v ~ Uo 我们关于概 
率的直观思想就是这样以出现的频率为基础的。 

更确切地说，设以 72) 是当0<_；<72时使得 T ； 的 J 的 个数； 当 72 趋向无 
穷大时我们要使比值 v ( n)ln 趋于值 

lim v ( n)l n — v - u (2) 

n-^°° 

如果对于所有的 Z / 和 r 的选择，这个条件都成立，那么就说这个序列是等分布的。 

设 SU ) 是关于整数 n 和序列 LA ， /7 2 ,…的一个命题。例如， SU ) 可以是上边 

考虑的命题“我们可以推广前一段中所釆用的思想，对于一个特定的 
无限序列来定义 SU ) 为真的概率。 


定义 A 设 v ( n ) 是对于 Oq < n ， 使得 S (]) 为真的 j 的个数。如果当 n 趋于无 

穷大时 v(n)ln 等于 A ，我//7就说 S{n)lU X 的概率为真。 用符号表示，如果 
limbec v ( n)/n = A ，则 Pr ( S ( n )) = A 0 

在这个记号下，当且仅当对所有实数 w ， p ，0 <w < t ;< l ， 有 PrU < R < T ；) 二 
-v ~ u 时，序列 L / o , ，…是等分布序列。 

一个序列可以是等分布序列而不是随机序列。例如，如果 U Q ， LA ，…和 V Q ， 
Vj ，…是等分布序列，不难证明，序列 


W 。， = f 1/。，言 + f ^，言仏，食 + 會 ％，… 


⑶ 


也是等分布的，因为子序列士 17。，+ !^，…在0与+之间是等分布的，而交替的项 


2 


2 


I + +专％，…是在皆与1之间等分布的。但在诸 w 的序列中，小于士的 


个值总是有一个大于或等于+的值跟随其后，反之 亦然； 因此，对于任何合理的定 


义，这个序列都不是随机的。可见，需要有比等分布更强的性质。 

等分布性质的自然推广，是消除上一段中所述的缺陷来考虑序列中相邻的数 
对。对于任何四个数 wuuhw ， 其中0<心< w < l ，0< w 2 < 我们可以 

要求这个序列满足条件 


Pr ( w 】 < r 和 w 2 < U n + l < v 2 )=( - Ui )( v 2 - U 2 ) (4) 

一 般来说，对于任何正整数 i 可以要求，序列在下列意义 下是々 分 布的： 


定义 B 当时,如果对于实数力，％的所有选择，其中0<士<%<1， 
132 - 
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皆有 

Pr ( W ] < U n < ，…， u k < + < v k ) = - u { )'''( v k - u k ) (5) 

成立， 则说序列 ( 1 ) 是 A 分布的。 

—个等分布序列是1分布序列。注意，如果 A >1, 则々分布序列总是々 -1 分 

布的，因为可以在等式 （5) 中置和& = 1。因此，特别地任何序列若已知是4 

_ 

分布的序列，必定也是3分布的，2分布的和1分布的。我们可以研究使给定的序列 
是々分布的最大的幻这就导致下面的 定义： 

定义 C 如果对于所有正整数 k ，一个序列是 k 分布的， 就说 它是 oo 分布的。 
至今我们已经考虑了“[0，1)序列”，即处于0与1之间的实数序列。同样的思 
想亦可应用于整值 序列； 我们说如果一个序列都是 

整数0，1， …， 之 一 ，就说它是 一 个6 进序列 ，于是二进序列是0和1的序列。 

我们也定义，一个 々位 6 进数是 k 个整数的一个串，其中对于 

々有 0< A <6 o 


定义 D 如果对于所有6迸数:有 


Pr(X„X„ + 


X 


n k - \ 




X A X 2 '''X k ) 



( 6 ) 


则说一个 b 进序列是 k 分布的。 

根据这个定义，显然，如果 U Q ， [^，…是一个 A 分布的[0，1)序列，则1_6[7 0 」， 
L 办 L / J ，…是 一 个 k 分布的6进序列。（如果置士 = xjl b y Vj = ( Xj + 1) I b ， X „ = 
L 心％」，则等式 （5) 即变成等式 （6)。） 而且，每个々分布的6进序列也是 u - 1) 分布 
的，当々> 1时:我们把诸6进数: 1) 的概 
率加在一'起，得到 



(不相交事件的概率是可 加的； 见习题5。）因此上面定义 C 中谈到〜分布的6进序 
列是很自然的事。 

在6进数系下，一个正实数的表示可以看成是一个6进 序列； 例如 re 对应于10 
进数序列3，1，4，1，5,9,2,6,5,3,5,8,9，"_。人们已经猜测，这个序列是⑺分布的， 
但还没有人能够证明它甚至是1分布的。 

现在我们在 k = 1000000的情况下更周密地来分析这些概念。1000000分布的 
一 个二进序列在一行中要有一百万个0的运行！类似地，一个1000000分布的 


[0，1)序列有一百万个相继值的运行，其中每个值都小于平均说来，发生这种情 

/ i \ 1000000 

况的可能性只有，但事实是它确实发生了。实际上，利用我们“真正随机” 

的直观概念，这个现象将在任何真正随机的序列中出现。人们很容易想像，如果把 
这一百万个“真正随机”的数的集合用于一个计算机模拟实验中，这样一种情况将会 
产生多么巨大的 影响； 有充分的理由来抱怨随机数生成程序！然而，如果在一个数 
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列中没有一百万个小于 | 的相继的运行，则这序列就不是随机的，而且它也不适 

合作为数据源用于任何需要极长的 U 的区段作为输入的场合。总之，一个真正的 
随机数序列将显示局部的非随机性。 在某些应用中，局部非随机性是必要的。但在 
其它一些应用中它是灾难性的。我们不得不作出 结论： 不存在对于每个应用都适当 
的“随机数”序列。 

类似地，人们可以论证，没有办法判断一个有限序列的随机与否；任何特定序列 
与任何其它的序列的可能性一样大。如果我们真想要有一个有用的随机性定义，则 
上述事实肯定是绊脚石，但也不必过于惊慌。我们仍然有可能给出实数的无限序列 
的随机性定义，而相应的理论（在适当的观点下）将使我们更透彻地理解在一台计算 
机上生成的通常的有理数的有限序列。而且，我们在这一节的后边将看到，对于有 
限序列，有若干可行的随机性定义。 

B . oo 分布序列现在我们就来对〜分布序列的理论进行简略的研究。为适当 
地描述这一理论，需要使用高等数学中的有关知识，所以我们在这节的剩下部分假 
定，读者已经知道通常在“高等微积分”课程中讲授的内容。 

首先推广定义 A 是方便的，因为那里出现的极限并非对所有序列都存在。我们 

定义 

Pr( S ( n )) = lim sup y ( n ) , Pr ( S(n)) = lim inf 〆 72 ) (7) 

n 一 Yl TL 

因此，如果 Pr ( SU )) 存在，它就是 El ( SU )) 与 K ( SU )) 的共同的值。 

我们已经看到，如果以 L 6 L 7」 来代替 U ，一 个 k 分布 [0,1) 序列导致一个々分布 
6进序列。我们的头一个定理证明反过来的结果也是真的。 


定理 A 设 （ U „) 二 …是一个 [0,1) 序列，如果序列 

〈 L~L^」〉 = J J ， L~L^2」 ，… 

对于在一个无限整数序列1< b 2 < b 3 < …中的所有 h 是一个 k 分布 的1?】进序 

列，则原来的序列(1^)是卜分布的。 

作为这个定理的一个例子，假设~=2\序列[2” () 」，[2 7 !7 1 」，〜实质上是1； () ， 
LA ， …的二进表示的头7位的序列。如果所有这些整数序列在定义 D 的意义下都 
是 A 分布的，则实数值序列，…在定义 B 的意义下也 必是々 分布的。 

定理 A 的证明如果序列，…是々分布的，则通过概率的加法可 
以证明 ：每当每个&和％ 是具有分母6的一个有理数时，等式 （5) 成立。现在设义， 
^是任何实数，，弋是具有分母6的有理数，使得 

u'j < Uj < u'j + llb ， v] ^ Vj < v] + llb 

设 S (?2) 是命题 < 7^ ，…， L 7„ + n < %，我们有 


Vr(S(n)) <Prf u 
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此亥 1 J 




<2 M 。 由于我们的不等式对于所有6 = ~成 


立，而且当 — 00 时~ —故有 

(v r - Uy)'-{v k - u k ) ^ Pr ( S(n )) < Pr ( S ( n )) < (- u x )'-(v k - u k ) I 


下一个定理是证明有关々分布序列的一些事实的主要工具。 


定理 B 设 （ U „) 是一个 k 分布 \ J )，1) 序列，而且设…， x k ) 是 k 个变量 
的黎曼可积函数，则 


lim 

oo 


n 


n ^, u ; 


0 <J < 対 


)+1 


U 




证明 


l ri 

… f{x x ， : ^)dvd 工々 

o Jo 


( 8 ) 


k 分布序列的定义指出，这个结果对于某些常数在 


/( JC 1 ，^ • • ， W 1 < Z 1 < P 1 ， • • •，以々工是 < % ] ( 9 ) 

的特殊情况下为真。因此，每当 /= a 1 / 1 + a 2 / 2 + … + 且每个/」是类型 （9) 的 

一个函数时，等式 (8) 为真; 换句话说，每当/是通过下列步骤得到的“阶梯函数”曰寸， 
等式 （8) 成立： 把单位 A 维立方体划分成一些子胞 （ siibcell )， 这些子胞的表面平行于 

坐标轴，并在每个子胞上对/赋予一个常数值。 

现在设/是任何黎曼可积函数。如果 f 是任何正数，则我彳&知道（由黎曼可积 

定义)存在阶梯函 数/和 7,使得/(〜，…，心）</(工1， …二 心）<7(々，…，々），而且 

使得/，/和7的积分之差小于~由于等式 （8) 对 于/和 /成立，且由于 


1 


n 


2 /(〜..，〜-!)< 


O^j < n 




n 


E / ⑴ 

Q^j < n 


-, u J+k . x ) < 


可以断定等式 （8) 对 / 亦真 。 I 


n 


S 7( ^ ， 


u ： 


J 十是一 1 


0^; < rt 



定理 B 可应用于例如 3.3.2 小节中的排列检验。假设（仏，/?2,…，九）是数丨1， 
2,…，幻的任何 排列； 我们要证明 

Pr ( U n + P ^ < U „ + p 卢 < …< U n + P x ) = llk \ (10) 

12 托 

为证此，假设序列〈1/„〉是 & 分布的，并设 

/( 々， ". ，々 ）= [Y < < …< x v 
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我们有 


U 


+ * — 1 


〈 u n +》 一 1 < 




< U 


n + p 


i) 


o 


/(^1 ，… yJO k )Ax 


% % 


dx 


o d ^ 


X 


p k … 


X 


p 


dx 


0 


p 


2 


X 


P 


dx 


0 


p 


k\ 


推论 P 如果一个 [ Q ， l ) 序列是 k 分布的，则在等式 （10) 的意义下，它满足阶为 
k 的排列检验 。I 


我们也可以证明，序列相关检验也能通过： 

推论 s 如果一个 [ 0，1 ) 序列是 a + 1) 分布的，则 u n 与1；„ + k 之间的序列相关 系 


数趋于 Q : 

lim 



(这里所有求和都对于进行。) 

证明由定理 B， 当 72 —oo 时，量 


= 0 





72 





71 





分别趋于极限|， 



现在我们考虑序列的某些稍微更一般的分布性质。通过考虑所有相邻的々元 
组，我们已经定 义了々 分布的概念。例如，当且仅当点 

( u 2 )，（ u 2 ， u 3 )，（ l / 3 ， u 4 )，（ u 4 ， u 5 )，一 

在单位正方形中等分布时，一个序列是2分布的。然而，很可能交替的点偶 （Ui， 
17 2 )，（17 3 ，[7 4 )，（[； 5 ，[7 6 )，〜本身并不是等分布的 ； 如果点（[7 2 „_ 1 ，17 2 „)的密度在 
某个面积中是不足的，则其它的点 （U 2 „，U 2 „ + 1 ) 可以弥补它。例如，周期长度为16 
的一个周期二进序列 

< X „) = 0,0,0,1, 0,0,0,1, 1,1,0,1, 1,1,0,1, 0,0,0，1， … (11) 

看得岀是3分布的，而且偶数号的元素的子序列〈叉 2 „>=0,0,0,0，1，0，1，0，一中0 

的个数是1的个数的3倍，而奇数号元素的子序列 〈X 2// + 1 >=0，1，0，1，1，1,1，1，〜 
中1的个数是0的个数的3倍。 

假设序列〈％>是⑺分布的，例 （11) 表明，交替项子序列〈仏„> = U 0 ， U 2 ， U 4 , 
U 6 ，…并非显然地保证是 oo 分布的，或者甚至是1分布的。但我们将看到，事实上， 
〈L/ 2 J 是〜分布的，而且甚至有多得多为真的事实。 


餐 
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定义 E 如果对满足 中 l < r < k ) 的所有实数〜，义的选择以 
及对于 Q < j < m 的所有整数』，有 

Pr ( 1/1 U mf1 +」〈 v i y ti2 U m>l + j . + i < V2 y * * * » U mn +) + 々一 i ) 一 

(^1 - U\) … （ V k - u k ) 

则说一个 [Q A ) 序列 （ U „) 是 （ m ， k ) 分布的。 

于是一个 々分 布序列是定义 E 中的 W = 1 的特殊 情况； 情况 m =2意味着在偶 
位置上开始的々元组必然和在奇位置上开始的々元组有相同的密度，等等。 

定义 E 的下列性质是显 然的： 

当 时，一个 （ m ， k ) 分布序列是 （ m ， k ) 分布的。 (12) 

对于 m 的所有因子 d ，一个 ( m,k ) 分布序列是 ( d，k )分布的。 (13) 

(见习题8。）和定义 D 中一样，我们也可以定义 （ m ，々） 分布的6进序列的概念，而且 
对于 （ m ，々 ） 分布序列，定理 A 仍保持成立。 

下一个定理在许多方面有些令人惊奇，它说明了〜分布的性质确实是很强的， 
比起我们先前考虑这个概念时所想像的要强得多。 


定理 C ( Ivan Niven 和 H . S . Zuckerman ) 一 个 00 分布的序列对于所有正整数 m 

和 k 都是 (m y k )分布的。 

证明利用刚才提到的定理 A 的推广，对6进序列证明这个定理就足够了。 
而且，还可以假定 m 二 I 因为 （12) 和 （13) 指出，如果一个序列是 （ m 々，/分布的， 
则它也是 （ m ，/0 分布的。 

所以，我们将证明任何^分布的6 进序列…对于所有正整数 m 都是 
( m ， m ) 分布的 。我们的证明是 Niven 和 Zuckerman 在 PadfcJ . Math . 1 (1951),103 
〜109上给出的证明的简化形式。 

证明用到的一个关键思 想是： “如果 m 个量的和以及它们平方的和，两者都符 
合 m 个量是相等的假设，则该假设就是正确的。”这一思想在许多数学论证中都是 
非常有用的。这个原理可以以更充分的形式叙述 如下： 


引理 E 对于 j < m ，给定 m 个数列 （ y jn ) = y jQ ， yj y ，…，假设 

lim(^U + + ■** + ymJ = 麵 

n 00 


lim SUp(^L + y\n + ••• + ylnn ) ^ 靈 1 

打 — oo 

则对于每个 j，\ im y jfl 存在并等于 a 。 

OO 

习题9给岀了这个引理的一个极其简单的证明 。 S 


(14) 


现在继续证明定理 C ， 设 ：^:二：^：^…：^ 是一个6进数，而且如果 X p - m + { 

+ 2 … \ = X ， 则说 J ： 出现在这个序列的位置 P 上。设 ( 72) 是当 P < n 和 p 
mod m = j 时，: r 出现于位置 f 的次数。 设 y jn 二4(打）/打 ，我们希望证明 


lim % 


n 



mb m 


(15) 
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首先我们知道 


lim(y 0n + )ln + …+ y(m-Dn) = 


b m 


(16) 


因为这个序列是 m 分布的。由引理 E 和等式 （16) 可知，如果能证明 


lim sup(yL + yfn + 


2 



2 、 ^ 1 




y ( 


m 


- 1 ) 72 ) 


m 


b 2 


m 


(17) 


则本定理即得证。 


这个不等式还不是显 然的； 在我们能够证明它之前，有必要釆取某些稍微巧妙 


的策略。设9是772的一个倍数，考虑 




00 < m 


^ Xn ) - v：(n - q )\ 


2 


/ 


(18) 


这是在位置仏， 九中 出现的 X 的数偶的个数，其中72 -(7<川<^ 2 <；2，且 p 2 - Pl 
是 m 的倍数。现在考虑和数 


N+q 


S/v 


C(n) 


(19) 


n 


在位置 p { , p 2 上出 现的工 的每个数偶都在总和 s N 中被计算 h ^ h 次，其中 
p \< p 2 < Pl + 

对于 N < h < p 2 <N + 这样出现的数偶被精确地计算了 N + q — p 2 H 


q，Pi — Pi 是饥 的倍数，且(即，当 + g 时）；而且 


设乂 （ n ) 是当 h 



t 


/?2< /2时，位置 h ， p 2 上 X 的数偶出现的个数。上边的 


分析表明 



(Q - rnt ) d mt (N + > S N > 


Q< ql m 



(q - rnt ) d mt ( N ) 


( 20 ) 


t < ql m 


由于原来的序列是 g 分布的，所以对所有的 t y 0< t < q / m , 


lim 


N 


N 


d mt ( N ) 



2m 


( 21 ) 


因此由 （20)， 


lim 

oo 


S/v 

iV 



q ~ mt 


Q\q 


m 


L< qjm 


b 


2 m 


2 mb 2 


m 


( 22 ) 


在做了某些处理之后，这一事实即能证明定理。 


由定义知 


N+q 


2S 


N 




71 


1 O^j < m 


((vj(n) - v } {n - g )) 2 - (( n ) - ^ ( n - q))) 


我们可以通过应用 （16) 消去非平方项来得到 


其中 


lim 

jv— oo 

t n 

N ~ 

: q(q - rn) 


N+q 


T N : 

- s 

2 (^ (^) 


m 



qlb 


m 


(23) 


)-v；(n ~ q)) 


n = l 
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利用不等式 
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r 



(2 


2 


r 


a ； 


< 



a 2 ； 


(参考习题 1 . 2 . 3-30) 求得 


lim sup 2 

N —°° o <；< 


1 




N(N + q) 


( 2 ( 


v ； { n 


)-Vj(n 


q(q - 


m 


b 2 


m 7 + A 




我们还有 

N+g 

qVj(N) K 2 b(n) = XI ( 4(?2) _ v/” — g)) < + g) 

N< n^N^q 71 ^ 1 

而且把这代入 （24) 给出 


(24) 


_ Q — JYl 1 

lim sup 2 (^(N)/N) 2 < — (25) 

N — o < j<m qmb Q ° 

当 g 是 m 的倍数时，这个公式是已经确立了的；令 9 — 00 ，即得到（17)，这就完成了 
证明。 

关于一个更简单的证明，见 J . W . S. Cassels , Pacific J . Math . 2 (1952)，555 〜 
557 。 I 


习题 29 和习题 30 说明了这个定理的不平凡性，而且它们也说明了 ：一个 g 分 

布序列的概率，同真正的 （ m ， 72) 分布概率相比，实际上顶多偏离1//^ (参考（25))。 

对于这个定理的证明来说， 00 分布的全部假设都是必要的。 

作为定理 C 的一个结果，我们可以证明，一个⑺分布序列能通过序列检验的 
极大值检验、冲突检验以及 3.3.2 小节中提出的对子序列的一些检验；不难证明，它 
也能通过间隔检验、扑克检验以及运行检验（见习题12到习题14)。集券检验处理 
起来要难得多，但也能通过（见习题15和习题16)。 

下一个定理保证了一类较为简单的 00 分布序列的存在。 

定理 F(L N . Franklin ) 对于几乎所有的实数，满足 

U n = 6 n mod 1 (26) 

的 [0 ，1)序列 L /。 ， L 7! ， L / 2 ，…是 00 分布的。 即，集合 \ d \ d>l 且 (26) 不是 00 分布/的 
测度为0。 

这个定理的证明和某些推广在 Mad . Cbmp 17 (1963)，28〜59中给出。 I 

Franklin 证明了，为使 (26) 是⑺分布的，<9必须是超越数。20世纪60年代初利 
用多精度算术，人们已经费力地计算出”<10000时的所有乘方〈/ mod 1>;而且对 
于每个这些数的最高35位，已存储在一个磁盘文件中，并被成功地用做一个一致离 
差的来源。由定理 F 看到，乘方 〈〆 mod 1>是 oo 分布的概率等于1;但由于有不可数 
多个实数，因此，关于 7 T 的序列是否真正⑺分布的，它什么也没有告诉我们。可以相 
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当保险地打赌 ：在我 们的有生之年，没有人会证明这个特殊序列不是 OQ 分布的，但也 
可能果真不是。由于这些考虑，人们当然要问是否有任何明确的⑺分布的序列 ，即: 
是否有一个算法，对于所有 ” >0，来 计算实数1^，使得序列 （ u „) 是⑺分布的? 回答 

是肯定的，如 D . E . Knuth 在 BIT 5 ( 1965)，246〜250中给出的例子所示的那样。 
在那里构造的序列完全由有理数 组成； 事实上，每个数％在二进制数系中都有一 

个有限的表示。一个明确的⑺分布序列的另一种构造，比刚才引证的序列略复杂 

些，可以从下面的定理 W 得出。也见 N . M . Korobov , Izv. Akad . Nauk SSSR 20 

(1956)，649 〜660。 

C.oo 分布=随机吗？ 综观以上关于⑺分布序列的全部理论，有一件事我们可 

以确信：⑺分布序列的概念是数学上一个重要的概念。同时也有大量的证据说明， 
下列命题是随机性的直观思想的一种正确的阐述。 

定义 R 1 如果一个 [0,1) 序列是一个 oo 分布序列，则定义它为“随机”序列。 

我们已经看到，满足这个定义的序列能通过 3.3.2 小节的所有统计检验，而且 
还能通过更多的检验。 

我们来试一下客观地鉴定这个定义。首先，每个“真正随机”的序列是 oo 分布的 
吗？在0与1之间有不可数多的实数序列，…。如杲选出一个真正的随机 

数生成程序，并令它生成值 LA ，…， 则任何可能的序列都可以看成是同等可能 

的，而且，某些序列（其实，是它们中的不可数多个）甚至不是等分布的。另一方面， 

利用在所有可能序列的空间上的概率的任何合理的定义，我们就能得出结论：一个 

随机序列是⑺分布的 概率为 1。因此这导致我们以如下的方式来形式化 Fmnklm 随 
机数定义（如本小节开头所给出的那 样）： 

定义 R 2 设 （ LO 为 [0,1) 的序列，( V n ) 是一致分布的随机变量独立抽样的序 
列，如果 P 是这样一种性质， g 卩每当 P (( V n )) 以1的概率成立时， p (( U n )) 也为真， 
则我们定义 ( U n ) 为随机序列。 

定义 R 1 或许可能等价于定义 R 2 吗？现在让我们彻底考察定义 R 1 的某些可 
能的异议，看看这些批评是否适当。 

首先，定义 R 1 仅涉及当⑺时这个序列的极限性质。有一些 co 分布序列，其 
中头一百万个元素全为0,这样一个序列也应看成是随机的吗？ 

这个异议不很得要领。如果 < 是任何正数，没有理由说一个序列的头一百万个 
元素不应全小于^ 一个真正的随机序列以概率1包含无限多个运行，其中每个都 
含有小于 < 的百万个相继元素，所以为什么这不能发生在这个序列的开头呢？ 

另一方面，考虑定义 R 2, 并设 P 表示“一个序列的所有元素都不同”这一 性质； 
P 以概率1为真，所以按这个准则，具有百万个0的任何序列都不是随机的。 

现在设 P 表示序列 没有元 素等于0这一 性质； P 又以概率1为真，所以由定义 
R 2, 任何具有一个零元素的序列都不是随机的。然而，更一般地，令： co 是0与1之 

间的任何固定的数，并设 P 是序列的元素都不等于&这一 性质； 定义 R 2 又指出， 
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没有随机序列能包含元素 A ! 我们现在可以证明，没有满足定义尺2的条件的序 

歹 !] 。 (因为如果 Uq ， (7! ，…是这样一个序列，则取別二 L / o 即否定了它 D ) 

因此，如果 R 1 是一个太弱的定义，那么 R 2 肯定是太强了。“正确”的定义必须 
不如 R 2 苛刻。然而，我们并未真正证明 R 1 太弱，所以让我们进一步处置它。如同 
上边所指出的，我们已经构造了一个有理数的 00 分布序列（其实，这并不那样令人惊 
讶； 见习题18)。几乎所有实数都是无理数，也许我们应坚持，对于一个随机序列来 

说： 

Pr ( U }1 是有理数 ） = 0 

等分布的定义等式 (2) 指出 Pr (“< U ”< v ) = V - u 。 利用测度论，有一个明显 
的方式来推广这个定义：“如果 SG [0，1) 是测度为 p 的集合，则对所有随机序列 

( UJ ， 

Pr ( U }> e s) = JU (27) 

成 立”。 特别是，如果 S 是有理数的集合，则它的测度为0,所以在这种推广的意义 
下，没有有理数的序列是等分布的。如果约定性质 （27) ，则预期定理 B 可以推广到 
勒贝格积分，以代替黎曼积分是合理的。然而，我们再次发现，定义 （27) 是太苛刻 
了，因为没有序列满足该性质！如果 Uq ， …是任意序列，则集合 S 二 i U 0i 

LA ，…丨的测度为0,但 Pr ( L /,, eS ) = l 。 因此借助于我们用来把有理数排除于随机 

序列之外的同样论证，也可以排除所有的随机序列。 

到目前为止，已证明定义 R 1 是站得住 脚的。 然而，对于它仍有某些完全有道理 

的异议。例如.，如果我们有在直观意义下的一个随机序列，则无穷子序列 

[^，[^几，％，…，"" 2 ，… （28) 

也应是一个随机序列。对于一个 00 分布序列，这并不总是正确的，事实上，如果我们 
任取一个 CO 分布序列，并且对所有”置0,则在々分布检验中的计数 v〆 77 ) 至 

多改变所以比值 v k ( n ) ln 的极限保持不变。定义 R 1 不幸不能满足这个随机 
性准则。 

也许我们应如下来加强定义 R 1: 

定义 R 3 如果一个 [ QA ) 序列的每一个无限子序列都是 00 分布的，则定义这个 
序列是“随机”序列。 

但是我们再次发现，这个定义太苛刻了 ；任何等分布的序列 〈 R ,〉 都有一个单调 

子序列且 u Sq <u Si <u S i < …。 

奥妙在于要限定这些子序列，使得它们在被定义时，不必考察 R 就能决定 R 
是否应属于这个子序列 U ，, 。现在引出下边的 定义： 

定义 R 4 令〈 LU 是 [ 0 ， 1 ) 的序歹 IJ ，如对于 n >0, 对于确定不同非负整数 h 的无 
限序列的每个能行算法，对应于这个算法的子序列 u Sq ， u Si ， u , 2 ，…是 oo 分布的，则 

说序列（ II 》是“随机的”。 
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定义 R 4 中所指的算法是给定72后计算&的能行过程（见 1.1 节中的讨论）。 
于是例如，序列 〈V mod 1>不满足 R 4, 因为它或者不是等分布的，或者没有一个能行 

的算法来确定一'个无限子序列&，使得 （7 t 5 o mod 1 ) < ( tt 5 i mod 1) < ( tt 5 2 mod 1) 〈…。 

类似地，任何明确定义的序列都不能满足定义 尺4;如果我们同意，所有明显地定义 
的序列都不是真正随机的，则这个结论就是适当的。然而，对于几乎所有实数沒> 
1，看似明显的序列〈俨 mod 1>实际上确实都满足定义 R 4; 这并不矛盾，因为几乎所 
有沒都不能由算法计算。 J . F . Koksma 证明了，如果&是不同正整数的任何序列， 

则几乎对于所有 6> l ，（ d 、mod 1>是 1 分布的 [Composido Math . 2 (1935)，250〜 
258] ; H . Niederreiter 和 R . F . Tichy 以 00 分布代替 1 分布，加强了 Koksma 的定理 
[Mathematika 32 (1985) ，26〜 32] 。仅仅可数多个序列〈&>是可有效地定义的，因 

此 〈<9 n mod 1〉几乎总是满足 R 4。 

定义 R 4 比定义 R 1 强 得多； 但断言定义 R 4 太弱仍然有道理。例如，设 〈 L 7 J 是 
一个真正随机的序列，而且以下列规则定义子序列 〈 L 7 5 > : 4 = 0;而且如果 n >0，& 

77 

是大于等于 w 的最小整数，使得 K :， L 7 5 - 2 ，…， U s _ „全部小于1 /2。因此，我们 

71 n n 

考察的是紧接于头一个连续的72个小于1/2的值的运行之后的值子序列。假设 
“ R < l /2” 对应于在一次硬币投掷中的“正面”值。假定使用的是一个真正的硬币， 

赌者势必感到，在“正面”多次出现以后，另一面，即“背面”出现的可能性就增加了。 
刚才定义的子序列 〈 L 7 S >对应于一个人的赌博系统，这个人在紧接着72个相继的“正 

n 

面”的头一个运行之后，下他的第 77 个赌注。赌者可能想 Pr ( L 7, >1/2) 是大于1/2 

YI 

的，但当然在一个真正随机序列里 〈 L 7 S >将是完全随机的。没有一个赌博系统能稳 

n 

操胜券！定义 R 4 没有说及根据这样一个赌博系统所形成的子序列，所以明显地我 
们仍需要更进一步的东西。 

让我们定义一个“子序列规则” A 是函数〈/„(^，…， x n )> 的一个无穷序列，其 
中对于 n >0，/„ 是/2个变量的一个函数，而且人（:^，…，的值或为0或为1。 
这里 A ，…，&是某个集合 S 的元素。（于是，特别是， / o 为一常 数函数，或为0或 
为1。） 一 个子序列规则 A 定义任何无穷序列的一个子序列如 下：当 丑仅当 
fAX 0 ， X ， …， X n — 0 = 1 时，第 n 项 X „ 在子序列 （ X n ) A 中。 注意，这样定义的子序 
列 〈Xj A 不必是无穷的，事实上它可以是空子序列。 

例如，刚才所述的“赌者的子序列”对应于以下的子序列 规则 ： “/o = l ; 且对于 
72>0，/„(：^，〜，：^) = 1当且仅当在0<々<；2的范围中有某个 I 使得当772 = 72 {I 

不是当 时，々 个连续的参数 ，工 m -1 ，•_•，工 m-Jk + 1全都小于1/2。” 

如果有一个能行的算法，当给定72和：^ ，…， &作为输人时，它确定 /„(&，•*•， 

的值，就说子序列规则 A 是可计算的。 当试图定义随机性时，我们最好把我们 

自己限制在可计算的子序列规则上，免得我们得到定义 R 3 那样过于苛刻的定义 。 
但是能行算法不能很好地处理作为输人的任意 实数； 例如，如果通过一个无穷的十 
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进制展开来确定一个实数： c ， 则没有算法可确定： r 是否小于+，因为需要考察数 

0.333 …的所有数字。因此，可计算子序列规则不能应用于所有的[0，1)序列。所 
以，把我们下一个定义建立在6进序列基础上是适宜的。 

定义 R 5 如果一个 b 进序列的每一个由可计算子序列规则定义的无穷子序列 
都是1 分布的，则这个 b 进序列是“随机”的序列。 

令 〈 U ”) 是一个 [0,1 ) 序列，如果对于所有整数 b >2， b 进序列 (IbUj )都是“随 

机”的 ，则 UO 是“随机 ，，的 。 

注意定义 R 5 仅说“1分布”，没说“〜分布”。验证这样做这并未失去一般性是 
有趣的。因为对于任何6进数~，…，^，我们可定义一个明显可计算的子序列规则 

W ( ai ， …，如下：当且仅当 n ^ k ~ 1 工 n - k + \ = a \ ■> ''' •> ~ \ = a k - \ X n ~ a k 

时，/^ A ) = 1。现在如果是一个 A 分布的6进序列，则这个规则 

〜（(^，…，(^ ) -它选择由那些恰恰在 a { r ^ , a k 的一个出现之后的项组成的子序 

列——定义一个无穷子 序列； 而且如果这个子序列是1分布的，则对于0<& + 1 < 

办，每个 A + 1元组 q ，…，~，七 + 1 在〈；0中出现的概率都是 lib 出。 于是，我们可 

以对々施用归纳法证明，满足定义 R 5 的一个序列对所有々都是々分布的。类似地， 
通过考虑子序列的“合成”规则——如果定义了一个无穷子序列，则我 

们可以定义作为使得 〈^>岣^? 2 = 的子序列的规则——可以 

证明，在定义 R 5 中考虑的所有子序列都是〜分布的（见习题32)。 

〜分布是定义 R 5 的一个非常特殊的情况，这一事实是令人鼓 舞的； 它是一个好 
迹象，表明我们最后可以找出所探求的随机性定义。但可惜仍然有问题。满足定义 
R 5 的序列是否必定满足定义 R 4, 这点尚不清楚。我们刚才描述的“可计算子序列 
规则”总是枚举子序列 〈足 >，其中…，但在 R 4 中并不要求〈&>是单调的， 

n 

它仅须满足条件：当 n ^ m 时，〜 

为解决这个异议，我们可以把定义 R 4 和 R 5 组合 如下： 

定义 R6 设 （ X n ) 是一个 b 进序列。如果对于把不同非负整数的一个无穷序列 
( s n ) 描述为 n 和值 X s ，…，又 的一个函数的每个能行算法，在定义 R 5 的意义下，对 

0 n - 1 

应于这个算法的子序列 （ x s ) 是“随机的”，则说 （ x n ) M “随机”的。 

n 

如果对所有整数 b >2、 b 进序列 〈 L 奶 J >是 “随机”的，则说[0，1 ) 序列〈 LO 是 
“随机”的。 

作者认为“这个定义确实满足随机性的所有合乎哲理的要求，因此它回答了这 
节中所提出的主要问题。 


至少当作者于1966年准备这一节的内容时，他是这么认为的。 


作者原注 
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D . 随机序列的存在性 我们看到，在不存在能满足定义 R 3 的序列的意义下， 
定义 R 3 是太 强了； 而上边的定义 R 4， R 5 和 R 6 的努力企图抓住定义 R 3 的本质特 
征。为了证明定义 R 6 所作的限制并不过分，我们仍必须证明，满足所有这些条件的 
序列是存在的。直观上，我们十分确信这样序列的存在是没有问题的，因为我们坚 
信存在一个真正的随机序列，而且它满足定义 R 6; 但是还是必须有一个证明，来说 
明这个定义是无矛盾的。 

A . Wald 给出了构造满足定义 R 5 的序列的 一 个有趣方法，该方法从 一 个非常 
简单的1分布序列开始。 

引理 T 设实数序列 （ V v ) 借助于二进系统定义 如下： 

Vq = 0， = . 1, V 2 = .01， V 3 = .11, V 4 = .001, … 

V , ? = . • C L 1 , 如果 72 = 2 r + ^:义― 1 + … + (29) 

命 h ... b 表示 [0，1) 中其二进表示以 0. S … b ,. 开始的所有实数的集合，于是 

I ) 

忍 .../) = [ (0. 卜… )2 ， （0. …~ ) 2 + 2 — 厂 ） (30) 

1 r 

这样，如果对于 0( k < n ) 表示 I b ... b 中％ 的个数，则我们有 

I r 

v { n)j n ~ r \ ^ lj n (31) 

证明因为 v ( 77 ) 是使々 mod 2 r = ( I …6 L ) 2 的是的个数，所以当 L n /2 ’」= Z 
时，有 = f 或 Z + 1 ， 因此 | \ j { n ) - ??/2 r |^lo I 

由 （31) 得出，序列 〈 L 2〃 VJ 〉 是一个等分布的2〃 进 序列； 因此由定理 A ，〈 是 

一个等分布的[0，1)序列。其实，很显然，〈\/, ; 〉的等分布性几乎和一个[0，1)序列之 

为等分布差不多！（关于这个序列及有关序列的进 一 步讨论，见 G . van der Cor - 
put ， Proc . ^Koninklijke Nederl . Akad . Wetenschappen 38 (1935 )，813 〜 821,1058 〜 
1066; J . H * Haixon,Numerische Math . 2 (1960) , 84 ^ 90 , 196 ; S . Haber ,J . Research 
National Bur . Standards B 70 (1966) ， 127 〜 136; R . B6jian 和 H . Faure，Compfes Ren - 
dus Acad . Sci . A 285 ( Paris , 1977)，313 〜 316 ; H . Faure J . Number Theory 22 (1986) ， 
4 〜 20 ; Stezuka ， ACM Trans . Modeling and Comp . Simul .3 ( 1993 )， 99 〜 107。 L . H . 
Ramshaw 已 经证明，序列 〈知 mod 1〉比〈〉稍微更多地是等分 布的； 见 J . Number 
Theory 13 ( 1981 ) ， 138 〜 175 。 ） 

现在设，^ 2 ,…是无穷多个子序列规则，我们希望求这样一个序列 〈 L /。〉， 使 
得所有无穷子序列都是等分布的。 

算法 W ( Wald 序列）给定定义有理数的[0，1)序列的子序列之子序列规则 
^? 1 ，" 2 ，一的一个无穷序列，下述过程定义一个[0，1)序列〈1^〉。在计算中涉及无 

穷多个辅助变量 Ch ，…， a ,. ]，其中 r > l ， 且对于< r ，~ = 0或1。这些变量 

开始时全为0。 

W 1. [初始化 7? ] 置0。 

W 2. [初始化 r ] 置 r-lo 
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W 3 .[检验 XV ]如果根据对于 0<6< n ) 的值，元素 R 是在由定义 

的子序列中，则置1，否则置0。 

\¥4.[[以，… ，心] 的情况尚未完成？]如果 （：[〜 ，… ，〜] 〈 S - V — 1 ， 则转向 

W 6。 

W 5.[ r 增值]置 r + 1, 并且转到 W 3。 

W 6 .[置 L /„] C [ q ，…，~]的值加1并命 々是 CUi ， …，七]的新值。 置 U ， 

%，其中％在上边的引理 T 中定义。 

W 7 •[推进77增加1并返回 W 2。■ 

严格地说，这不是一个算法，因为它不终止。但是，当然可以很容易地修改这个 
过程使 n 达到一个给定值时就停止。读者如想掌握此构造的思想，建议用手工试 
验，在试验前以 Y 代替步骤 VT 4 的数 3-4 r_1 o 

算法 W 并非打算作为随机数的一个实际来源。它只试图为理论的目的服务。 

定理 W 设（1^)是由算法 W 定义的有理数序列，并设 k 是一个正整数，如果子 
序列 （ U „) 八是无穷的，则它是1分布的。 

证明命 A [^，…，^]表示〈[；„>的（可能是空的）子序列，它恰巧包含具有如 
下特征的元素：对于所有，如果 CLj = 1，它们属于子序列〈 U „ ) ，如果 七 =0,则 
它们不属于〈 U „) %。 

只须证明，对于所有 r > l 和所有二进数数偶 q …七和 ，每当子序列 A 
[ q ，…，心]是无穷时，相对于此子序列有 Pr ( U n e I b ... b )=2〃 [见等式（30)]。因 

\ r 

为如果 r ^- k ，则无穷序列〈是所有〜=1和七= 0或 1( 其中 ，jm 
的不相交子序列 A [q ，…，^]的有限并。由此推出相对于〈 L /„> 义有 Pr ( U n 6 
h )=2〃 （见习题 33)。 由定理 A , 就足以证明这序列是 1 分布的。 

1 r 

命，…，~]表示 〈 L / J 的这样的子序列，它由在算法步骤 W 6 中使 C [ a { . 
…，〜]加1的那些72的值组成。由这个算法，，…，~]是至多有 3 XV — 1 个元 
素的有限序列。 A [ q ， …，^]除了有限的成员夕卜，全都来自子序列，…，^， 
…， a ,] ，其中对于 r <_;< Z ， 七 = 0或1。 

现在假定 A [ a !， … ，〜] 是无穷的，且设 Atq ，… ，〜] =〈{7,〉，其中5 0 < 5) < 

n 

s 2 < …。如果 N 是一个大整数，且4〃<4 (? <]\/<4 (? + 1 ，则由此推知，使得1/ 5 在 J 6 ... 6 

k 1 r 

中的 AU < N ) 的值的个数（除了在子序列开头处的有限个元素外)是 

w ( iV ) =+ v { N m ) 

这里 m 是上边所列子序列，…， a ,] 的个数，其中 t / 5 对于 某个々 （々< N ) 出现， 

k 

N J 是使 L / 5 在对应子序列 中的々 值的个数，而且 v ( N ; ) 也是在& 中的这样的值 

々 1 T 

的个数。因此，由引理 T ， 
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\AN) -2 - r N 二 - 2 -％ + … + y(NJ - 2- r N w |< 

I ^(N x ) - 2- r N { I + …+ I v(N m ) - 2U< 

m<l+2 + 4+ … 十 2 q ~ r+l < 2 q + [ 

关于 772 的不等式，是从这样的事实得岀的 ：由我 们对于 N 的选择，对于某个+ 
1，兀素在 B [ a ! ，…，〜]中。 

N 

我们证得 I v ( N ) lN -2- r \<2 q + 1 lN <2_。' 

为了最后证明满足定义 R 5 的序列是存在的，我们首先说明，如果 〈 R 〉 是有理 

数的一个[0，1)序列，而且如果 W 是一个6进序列的可计算子序列规则，则通过使 
中的/(々，…，: rj 等于 A 中的 AafeJ ，…， L 〜 J )， 可以使 W 成为〈％〉的一 

个可计算子序列规则/。如果 [ 0，1 ) 序列〈〉 〆 是等分布的，则6进序列 

也是等分布的。现在6进序列的所有可计算的子序列规则的集合（对于 

b 的所有值来说)是可数的（因为仅仅可能有可数多个能行的算法），所以它们可以 
列成某个序列 …； 因此算法 W 定义了一个[0，1)序列，它在定义 R 5 的意义 

下是随机的。 

这把我们带到有些似是而非的境地。如同我们早先所述，没有一个能行算法能 
确定一个满足定义 R 4 的序列。由于同样的原因，也没有能行的算法能确定一个满 
足 R 5 的序列。这样的随机序列的存在性证明必然是非构造性的，那么算法 W 怎么 
能构造这样一个序列呢？ 

这里并没有矛盾，我们先前的困难仅仅在于 ：所有 能行算法的集合不能被一个 
能行算法所枚举。换句话说，没有能行的算法来选择第 j 个可计算的子序列规则 
这是由于不存在确定一计算方法是否终止的能行算法的缘故。但是我们能够系 

统地枚举很广的重要算法类。举例来说，算法 W 证明，如果我们限于考虑“本原递 
归”的子序列规则，则通过一个能行的算法，可能构造一个满足定义 R 5 的序列。 

通过修改算法 W 的步骤 W 6, 使其置 — 而不是 R ， 其中/ 是与〜，•••， 

a r 相关的任何非负整数，我们就可以证明，有 不可数 多个满足定义 R 5 的[0，1)序 
列。 

以下定理证明存在另一个方法，可以证明不可数多个随机序列的存在性，这里 
用的是以测度论为基础的较为间接的证明，可是使用了强定义 R 6。 

定理 M 如果实数 x ( Q < x < l ) 的二进表示是 （(L XoXy …） 2 ，命 x 对应于二进 

序列 ( X n ) o 在这个对应之下，几乎所有的 x 都对应于 在定义 R 6 的 意义 下随机的二 

进序列。 (换句话说，所有对应于按定义 R 6 为非随机的二进序列的实数1的集合， 
有测度0。） 

证明 命』 是一个能行算法，它确定不同非负整数〈心〉的一个无穷序列，其中 
5 W 的选择仅仅依赖于 w 和 X ，0< A <〃 ； 且设 A 是一个可计算的子序列规则。这 

k 

样，任何二进序列 〈 X „〉 导致一个子序列 〈尤 〉 A 。 定义 R 6 指出，这个子序列必须是 

n 
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有限的或是 1 分布的。 只须证 m ，对于固定的 a 和 s ，对应于 （ x n ) 而且使得 （ x s )a 

U 

是无穷和非1分布的所有实数 X 的集合 N ( A，S ) ，有测度0。因为当且仅当： T 在 

)中（这里的并取遍所有可数多个 A 和2 )时，: T 有一个非随机的二进表 

/」、 o 

于是命 A 和』 固定，把对于所有二进数 ai a 2 ”. a r 定义的集合了 …七）当 
做是对应于 〈 X „〉 的所有 x 的集合，使得 〈足〉 W 有大于等于 r 个元素，它的头 r 个 

兀素分别等于 a 1， (2 2，…，<2/。我们的头一^个结果是： 

T ( a } a 2 -- a r ) 的测度 < 2〜 (32) 

为证此，我们从观察一个可测集合 开始： 了 （ ^心 …〜） 的每个元素 
是一个实数^ = (0.;^;^广0 2 ，对于它存在一个整数价使得算法2确定不同的值 
Sodi ， … ，& ，而且规则4确定 x 5 ，足，…， X 5 的一个子序列，使得是这个序列 

0 1 ;/i m 

的第 r 个元素。所有使得对于有 K = X S 的实数 3 ; = (0. YoY ^- Oz 的集 

k k 

合，也属于 …〜) ，而且这是由二进子区间忍 b 的有限的并组成的可测集 

1 t 

合。由于仅有可数多个这样的二进区间，我们看到，丁（心心……）是可数多个二进 
子区间的并，因此它是可测的。其次，这个论证可加以扩充证明的测 
度等于••〜_!1)的测度，因为后者是从前者通过要求对于 0< A < m 有 K = 

X 且1 ^ X 5 而得到的二进区间的并。现在由于 

k m m 


T ( a x '- a r - { 0) U T ( a ] •■* a r _ 1 l ) Q T { a x '- a r . x ) 

:的测度至多等于 7(“ J 测度的一半，不等式 （32) 由对 r 用归纳 

法推得。 

现在已经证得（32)，剩下的实际上是要证明 ：几乎 所有实数的二进表示都是等 
分布的。对于 0< f < l ， 命 B ( r ，（） 是 U 丁（〜…〜），这里的并取遍所有这样的二进 

数串心…心，对于这些 a x '- a r 当中1的个数 v ( r ) 满足 


v(r) 






> 6厂 


这样的二进数的个数是 C ( r ，<) = 这里对满足 k~\r >化的々值求和。 

K / 2 

、 I 

习题 1.2.10-21 证明 C ( r ， f )<2 r + 1 e — 人；因此由（32)， 

- B(r,0 的测度 <2 — r C(r，d < 2e—(33) 

下一步是定义 

B* (r,0 = B(r,0 U B( r + 1,0 U B(r+2 ， e) U … 

B K ( r ，<) 测度至多是 S ^ r 2 e -^， 而这是一个收敛级数的余部，所以 

lim(B * ( r ， （） 的测度 ） = 0 (34) 

厂一^ 03 
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现在如果 I 是这样一个实数，即其二进展开 （ o . aa …） 2 导致不是1分布的一个 
无穷序列〈 X 〉4,而且如果 v ( r ) 表示在该序列的头 r 个元素中1的个数，则对于 

某个 f >0 和无穷多个 r ， 



这意味着对于所有 r ， i 在中。所以最后我们求得 


iV(^?，』）=U f] B" (r y ll t) 


而且由 （34) .对所有 I ( r ， lM 的测度为0,因此 ) 有测度0 。 I 

由满足定义 R 6 的二进序列的存在性，我们可以证明在这个意义下随机的 [0，1) 


序列的存在性，详见习题36。由此确立了定义 R 6 的无矛盾性。 


E . 随机有限序列上边给出的论证指出，不可能对有限序列定义随机性的概 
念； 任何给定的有限序列与任何其它的序列是同样可能的。然而，几乎每个人都会 
同意，序列011101001要比101010101“更随机”些，而且甚至这后一序列也比 
000000000 “更随机些”。尽管真正随机的序列确会显示出局部的非随机特性，但我 
们期望这样的特性仅仅出现在一个长的有限序列中，而不是在一个短的有限序列 

中。 

人们提出了若干方法来定义一个有限序列的随机性，这里将仅仅概述其中的某 
些思想：为方便起见，只限于考虑6进序列的情况。 

给定一个石进序列…，，我们可以说 


Pr ( SU )) 



P ， 


如果 I AN)lN - 户 |< 1/ v^v 


(35) 


其中 


)1 


) 是这一节开始处定义 A 中出现的量。如果对于所有6进数:有 


上边的序列可称为 


Pr(H 

2分布”的 


+ 1 


« i 4 


X 


” - 1 


工1工2…工左 



lib 



(同定义 D 做比较。不幸的是，按这个新定义， 


(36) 

一个 


不是 U - 1) 分布的序列，却可以是々分布的。） 

现在可以模仿定义 R 1 来给出一个随机性的定义。 


定义 Q 1 如果对于所有正整数 k < log b N ，一个长度为 N 的 b 进序列是 k 分布的 

(在上述意义下），则说它是随机的序列。 

例如按照这个定义，有178个长度为11的非随机二进序列 •. 

00000001111 10000000111 11000000011 11100000001 11110000000 

00000001110 10000000110 11000000010 11100000000 11010000000 


00000001101 

00000001011 


10000000101 

10000000011 


11000000001 

01000000011 


10100000001 

01100000001 


10110000000 

01110000000 


00000000111 

加上01010101010,以及有9个或更多个0的所有序列，加上从上边诸序列中通 
过交换1和0而得到的所有序列。 
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类似地，、我们可以叙述对应于定义 R6 的有限序列的定义。命 A 是一组算法， 
其中每一个算法都像在定理 M 的证明中那样给出子序列 〈X 的一个组合挑选 

n 

和选择过程。 

定义 Q 2 b 进序列 X Q ， Xi , X 2 , …， 游为 相对于算法集 A 是 （ no ) 随机的， 
如果对于由 A 的算法确定的每一个子序列 XpX , ，…， X t ，我们有 m < n 或者 

I 2 rr . 

丄匕 U" …， x ) - -f <6， 对于< 6 

771 1 爪 b \ 

这里 匕 （A ，…， ) 是序列 工' ，…，工⑺ 中 a 的个数。 

(换句话说，由 A 的一个算法确定的每一个充分长的子序列，都必须是近似地等 
分布的。）在这种情况下的基本思想是命 A 为一组“简单”的 算法； A 中算法的个数 
(及复杂性）可以随 N 的增长而增长。 

作为定义 Q2 的一个例子，我们考虑二进序列，并设 A 就是以下四个 算法： 

a ) 取整个序列。 

b ) 由头一项开始，取序列的交替项。 

c ) 取序列的在一个0之后的项。 

d ) 取序列的在一个1之后的项。 

现在一个序列，…，相对于 A 是随机的，如 果： 

由 a )，+( X 0 + X 1 + …十<含，即如果有3,4或5个1; 

由 b )，-^( X 0 + X 2 + X 4 + X 6 )-y ■，即如果在偶数号数的位置中恰有两 

个1; 

由 c ), 根据有多少个0 占据位置，…， X 6 , 存在着三种可 能性： 如果在这里有 

2或3个0,则没有条件要检验（因为 n =4); 如果有4个0,则它们必须分别跟有2 
个0和2个1;而如果有5个0,则它们必须分别跟有2个或3个0; 

由 d )， 我们得到类似于由 c ) 所蕴涵的条件。 

结果是，对于这些规则，仅有下列长度为8 的二进序列是随机的，即 

00001011 00101001 01001110 01101000 

00011010 00101100 01011011 01101100 

00011011 00110010 01011110 01101101 

00100011 j 00110011 01100010 01110010 

00100110 00110110 01100011 01110110 

00100111 00111001 01100110 

加上由一致地交换0和1得到的那些序列。 
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显然，我们可以把这算法的集合扩充成如此之大，以至当 n 和^相当小时，没有 
序列能满足这个定义。 A . H . Kolmogorov 已经证明，对于任何给定的 iV ， 如果 A 中 

算法的个数不超过 


je 2m (1 ~ () (37) 

则将总存在一个 U 以）随机二进序列。这个结果还未强到足以证明满足定义 Q 1 的 
序列的存在。但利用习题 3.2.2-21 中 Rees 的过程，即可有效地构造出这样的序列 

来。基于离散傅里叶变换的一个广义谱检验可用来检验根据定义 Q 1 对一个序列 
的测定好到什么程度[请见 A . Compagner , Physical Rev . 52 (1995) ,5634〜5645 ] 。 

Per Martin - Lof 采取了另外 一 种有趣的方法来定义随机性 [Information and 

Control 9 (1966) ,602 — 619] 。给定一个有限的6进序列 A ，…，，令 I ( X ^ ，…， 

X . Y ) 是生成这个序列的最短的图灵机程序的长度。（或者，我们可以使用其它类的 

能行算法，如在 1.1 节中讨论的那些。）于是， /(& ，…， X Y ) 是这个序列的“无模式”的 

一 个测度，而且我们可以把这个思想和随机性等同起来 3 使 ，…， X N ) 取极大 

值的长度 N 的序列可称做随机的。（从通过计算机生成实用随机数的观点看，当 
然，这是可以想像的“随机性”的最坏的定义！） 

大约在同一时间 G . Chaitin 独立地给出实质上相同的随机性 定义； JjUACM 16 
(1969),145 〜 159。有趣的是，尽管这个定义没有像我们的其它定义那样提到等分 
布的性质， Martin - L 6 f 和 Chaitin 已经揭示，在适当的意义下，这种类型的随机序列 
也有短期的等分布的一些性质。事实上， Manm - L 6 f 已经证明，在适当的意义下，这 
样的序列满足关于随机性 的所有 可计算的统计检验。 

关 于随机有限序列的定义方面进一步的发展 ，请见 Zvonkin 和 L . A . Levin , Us - 
pekhi . Mar , A’auic 25，6 ( 1970年 11 月 ），85 〜 127 [英文翻译见 _ Russ/an Math . Surveys 
25 ,6(1970 年 11 月 ) ，83 〜 124] ； L . A . Levin ,Doklady Akad . Nauk SSSR 212 (1973) ， 
548 〜 550 ; L . A. Levin ， Information and Control 61 (1984) 15 〜 37。 


F •拟随机数从理论观点了解到，存在各种风格的随机有限序列，是令人愉快 
的。但是这样一些定理并没有回答现实生活中的程序员们所面临的各种问题。基 
于有限序列集合的研究，最新的发展已经导致一个更恰当理论的出现。更精确地 
说，我们考虑序列可以出现一次以上的多重 集合。 

设 S 是含有长度为 N 的二进位串（二进制序列）的一^个多重集合；我们称 S 为 
一个 N 源。设表示包含所有2~个可能的 N 位串的」 V 源。 S 的每个元素表示我 

们可以用做拟随机二进位的一个来源的 序列； 选择不同的“种子”值导致 S 的不同 

元素。例如，在由 X J + 1 = ( aX ; + c ) mod 2^定义的线性同余序列中 S 可以是 

/ 

\ B [ B 2 -- B n \ B j 是4的最高有效位1 (38) 

其中对于 Y 个起始值 X 。的每一个，有一个串… 

如同本章所见到的那样，拟随机码序列的基本思想是得到看上去是随机的 N 
个二进位，尽管当选择种子值时我们仅仅依赖于一些“真正的”随机二进位。在刚刚 
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考虑的例子中，我们需要 e 个真正随机的二进位来选择 Xo ; —般来说，选择 S 的一 

个成员相当于使用 lg | SI 个真正随机的二进位，在那之后我们就确定地进行了。如 
果 N = 10 6 和 | S | =2 32 ,那我们对于扩展的每个真正随机的二进位就要得到多于 
30 000个“看起来随机”的二进位。对于而不是 iV ， 我们就得不到这样的扩大，因 

为 ig I I = No 

“看起来随机”意味着什么呢？ 1982年 A . C . Yao 提出了一个很好的定义 ：考虑 
任何算法 A ，它考察一个二进位串 B = ，而且输出 A ( B ) = 0 或1，我们可以 

把 A 想像为对随机性的一个 检验； 例如， A 可以计算连续的0和1的运行的分布。 
而且如果运行的长度十分不同于预期的分布则输出1。每当 A 如此进行时，我们可 
以考虑当 B 是 S 的一个随机选定的元素时 A ( B ) = 1 的概率 P ( A ， S )， 而且我们可 
以把它同当 B 是长度为 N 的一个真正的随机二进位串时 A ( B ) = 1的概率 P ( A , 
$ N ) 做比较。如果对于所有的统计检验 A ， P ( A ， S ) 极其接近 P ( A ，$ N ) ，我们就无 

法区别 S 的序列和真正随机的二进位序列。 

定义 P 如果 | P ( A , S )- P ( A ，$、 n ) \ < ^则我们说对于容差（，一个 N 源 S 通 

过统计检验 A •，如果 \ P ( A , S )~ P ( A ,$ N )\> e ，则它不通过这个检验。 

算法 A 不必由统计学家来设计。按照定义 P ， 任何算法都可认为是随机性的一 
个统计检验。当 A 实施它的计算时，我们允许 A 投掷硬币（即使用真正的随机二进 
位）。 惟一的要求是 A 必须输出0或1。 

当然，实际上还有另一个要求 ：我们 坚持， A 必须在一个合理的时间之内派送它 
的输出，至少是平均说来。我们对于要花费许多年来运行的算法不感兴趣。因为如 
果我们的计算机在我们的有生之年不能发现 S 和$.~的区别，那我们也就永远不会 

注意到它们的区别。 S 的序列仅包含信息的 lgl S I 位，所以肯定地会有这样的算 
法，它们将最终会检测到冗 余性； 但我们不在乎，真正要紧的是，只要 S 能够通过所 
有的检验。 

如同我们将要看到的那样，这些定性的思想可加以定量化。这个理论是相当微 
妙的，但它是充分漂亮和重要的。因此花上时间仔细地研究其细节的读者必将获益 
匪浅。 

在以下的讨论中 ，把一 个算法 A 在 N 个二进位串上的运 行时间 了 （ A ) 定义为 
输出 A ( B ) 预期需要的步骤数的极大值。取极大是对所有 B ^ Sv 进 行的； 预期数 

是对于算法所做的所有硬币投掷取平均的。 

在我们的定量分析中的头一步是来说明，我们可以把检验限制为有非常特殊类 
型的。令 A , 是这样一个算法，它只依赖于输入串 B = B 「‘ B \ 的头 A 个二进位，其 

中 0<々< iV ， 并设 A p k ( B ) = ( A ,( B ) + J 3, + 1 + 1) mod 2。因此当且仅当 A & 成功地 
预测坎 + 1 时 Af 输出1;我们称 Af 为一个预测检验。 

引理 P1 设 S 是一个 N 源，如果 S 不能通过带有容差 t 的检验 A , 则存在一个整 
数々6 \0,1，.“，1^ — 1\和满足 T ( Af )< T ( A ) + O ( N ) 的一个预测检验 A p h ，使得 S 
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不能通过带有容差 dN 的 Af 。 

证明如果必要，通过补充 A 的输出，我们可以假定 P ( A ， S )- P ( A ，$ n )> 
io 考虑算法匕，它通过投掷 N - k 次硬币并且在执行 A 之前以随机二进位 B “广. 

来替代私算法 F n 和算法 A 是一样的，而对 S 的动作就如同 A 对 
S . v 的动作那样。设久 = P ( F 々， S )。 由于(九 + 1 -九）= - 如二 P ( A ， S ) _ 
P ( A f S 因此存在某个々使得 Pk + i ~ p ( IN 。 

设 Af 是实施心的计算并且预测值（巧（5) +冗 + 1 + 1) mod 2的 算法； 换句话 
说，它输出 

A p k ( B ) - ( F k ( B ) + B k + Y + B y k + l ) mod 2 (39) 

对概率的仔细分析表明 P ( A p k ) S )- P ( A p k) $ N ) = p k ^~ 九（见习题40)。 ■ 

长度为々的每一个子串仏…私， + 1 ，…， Bn + 1 … 都有相同的概率 

分布。在这个意义下，有实用价值的大多数 iV 源都是 移位对称的。 例如，当 S 对应 
于 （38) 中的一个线性同余序列时，这一点成立。在这样一些情况下，我们通过取 
々 = N - 1可对引理 P 1 进行改进。 

引理 P 2 如果 S 是一个移位对称的 N 源，它不能通过带有容差6的检验 A ，则存 
在满足 TiAKTiA ) + o ( N ) 的一个算法 A 、 它以至少 I + elN 的概率从 Bf 

中预测 B n 。 

证明如果 P ( A ， S )> P ( A ,$ N ) ，设 A / 是在引理 P 1 的证明中的 Af ，但被应 

用于…0而不是 B r "£ N 。 于是 A ' 由于移位对称性，有相同的平均 

行为。如果尸（八，5)<尸（义，^)，设^是在同样的方式下的 1- Af ， 显然， 

P ( A / , S v ) = l /2 o I 

■ 

通过假定序列 BA … B n 的每一个在 X q 取遍某个集合 X 时，都有 f ( g ( X 0 )) 

的形式，其中 g 是 X 的一个排列而且对于所有的 xG 

X ，/( x ) 为0或1。我们进一步来确定 S 。 对于 X 二 i 0， l ， …， 2 e — i l , g ( x ) = U： c + 
c ) mod 2%以及 /(： r ) 等于： r 的最高有效位，我们的线性同余的例子满足这个限制。 
这样 一 ^种 iV 源称为是迭代的。 

引理 P 3 如果 S 是一个迭代的 N 源，它不能通过带有容差 ( 的检验 A ，则存在一 
个满足 T ( AKT ( A ) + O ( N ) 的算法 A ' ，它以至少$ + JN 的概率从 By 中 
预测 B 10 

证明一个迭代的 N 源是移位对称的，因此它的反射炉= | B 「. B n 
丨也是。因此引理 P 2 适用于炉。 ■ 

在排列 gU ) = U：c + c ) mod 2^中，只要 a 为奇数，我们就可以由 g ( sc ) 确定 sc , 
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在这个意义下，它容易反演。但很多容易计算的排列函数却是“单向”的——即难以 
反演的——因而我们将看到，这使得它们成为可证实的拟随机数的好来源。 

引理 P 4 设 S 是对应于 f ， g 和 X 的一个迭代的 N 源。如果 S 不能通过带有容 
差 f 的检验 A ，则存在一个算法 G ，当 x 是 X 的一个随机元素时，给定 gU ) ，它以大于 

等于+ + 的概率正确地猜测 / U )。 运行时间 : T ( G ) 至多是 T ( A ) + O ( N ) • 

( T (/) + T ( g )) 0 

证明给定^二以:^所求算法。计算 B 2 = /( gU ))， B 3 = /( g ( gU )))， …， JB n 

= /( g [: v - 1] U ))， 并且应用引理 P 3 的算法 A 、 它以大于等于+十的概率猜测 

f ( x ) = ，因为 g 是 X 的一个排列，而且 B r - B N 是对应于种子值 Xo 的 S 的元 
素，对于它我们有 g ( X Q ) = x 。■ 

为了使用引理 P 4, 我们需要把猜测单个二进位/(工）的能力增大到猜测工本身 
的能力，而只须给出 g (： r ) 的值。 如果我们扩充 S 使得需要猜测许多不同的函数 
/(: r ) ，则使用布尔函数的性质，有一个很好的一般的方法来做这件事。（然而，这个 
方法是稍微技术性的，因此头一次阅读的读者在仔细考察以下的细节之前可以跳到 

后面的定理 G 去。） 

假设 是在只 个二进位串上的一个二进制值的函数，对于某个固定 

的 ： r = ，它在猜测形如 /(2 V ••印 ） 二（上1之1 +…+ X R Z R ) mod 2 的一个函数 

方面是很好的。通过计算预期值 

5 = E ((- l ) GU i "'^ ) + J : i z i + '" + J ^) (40) 

并对^…❹的所有可能性取均值，来测量 G 的成功是很方便的。这是正确猜测之 

和减去不正确的猜测，除以 2 R ; 所以，如果 P 是 G 正确的概率，我们有 s = p -( l ~ 

P ) 或 P = y + 士5。 

例如 ，假设 只 = 4 和 0 ( 2 ^ 2 : 22 : 3 : 2 : 4 ) = [之1 关之 2 ] [之3 十 之 4 〈 2]。 如果 J ： = 1100, 此 

函数有成功率5 =导（和 P = i)o 因为对于所有4个二进位的串％除 om 或1011 

4 o 

之外，它等于 oc • 2 ： mod 2 = (Zi 十 22 ) mod 2。当 ： r = 0000，0011，1101 或 1110时’匕 

也有成功率所以对于： C 有5个似真的可能性。其他11个工使 5 <0。 

在刚才描述的意义下，当 G 是一个成功的猜测程序时，下列算法在大多数情况 
下都奇迹般地发现: r 。 更确切地说，这个算法构造出极可能包含工的短的表。 

算法 L (线性猜测的扩大） 给定一个二进制值函数 G (2 Vz R ) 和一个正整数 
々，本算法输出 2 * 个二进序列：的一个表而且有这样一个性质，即当 
G ( yzp ) 是函数（:+ … + ) mod 2的 一 个好的近似时，可能是输出。 
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L 1. [构造一个随机矩阵]对于和1<7<只生成随机二进位氏」。 
L 2 .[计算符号]对于只和对于所有的二进位串心二心…、，计算 


hAb ) 


〉: ( _ 1 ) 6 ■ c + G ( cB + e , 〉 


(41) 


#0 


其中是有1在位置2的及个二进位的串0…010…0,而且其中 cB 是有4 


( ^ 1 1 



m m 


mod 2 的串 


•"d R 


O 


(换句话说，二进制向 


… c k 


乘以 Ax 只二进制矩阵 JB 。） 求和是对于所有不等于0…0的所有 2+-1 个 


进位串 


Ci -1# 


进行的。利用对于阿达马变换的 



方法，对于每个 i 它 


可以用 12* 个加法和减法来计算。见等式 4.6.4-(38) 下面的说明。 


L 3 .[输出猜测] 


对于 b = *** b k 的所有2+种选择，输出串 x ( b ) = [ hyib ) 


〈 0]… [A 尺（ 6)<0]。I 


为了证明算法 L 适当地工作，我们必须证明 ，一 个给定 的串工 大概将是输出， 
每当它值得成为输出时。首先注意，如果我们把 G 变成 G ' 其中 G / ( Z ) = ( G ( z ) + 

Zj) mod 2,则原来的 G ( z ) 是 x * z mod 2的 一 个好的近似当且仅当新的 G '( 2 ：) 是 
+ mod 2的好的近似时，其中~是在步骤 L 2 中定义的单位向量的串。而 

且，如果我们应用算法到 f 上以代替 G ， 我们得到 

h](b) = ^] ( - l )b-c + G(cB + eM(cB + e i )-e j = (- l) S i } h } ((b + B } ) mod 2) 

c ^0 

其中是召的列 J 。 因此步骤 L 3 输出向量 JC ' O ) =工（（ 6 十爲 ） mod 2 ) + ~，对 2 

取模。当6跑遍所有々个二进位的串时， （6 + 马 ） mod 2也是，其效果是在输出中对 
每个: r 的位 j 取补。 

因此我们只需证明，每当 G ( z ) 是常量函数0的一个好的近似时，向量工= 0“-0 
可能是输出 。 事实上，我们将证明，每当 GU ) 相比之于为1更有可能为0时以及当 
k 充分大时，在步骤 L 3 中 x (0 … 0) 以高的概率等于0…0。更精确地说，当对于^的 
所有 2 R 种可能取平均值而且 A 足够大时，如果 5 = E (( - 1) GU ) ) 为正，则对于1< 

i < R , 

2 (- i) GUB+e l ) > 0 

c ^0 

以大于1/2的概率成立。 

关键的发现是，对于每个固定的。=^ 1 一以#0."0，串 d 二 cB 一致地分布 d 的 

每个值以 ll 2 R 的概率出现，因为 B 的二进位是随机的。其次，当 = 

时，串 cB 和 /二， B 是独立的 ：串偶 的每一个值以 l /2 2 i ? 的概率出现。 

因此，如同在切比雪夫不等式的证明中那样，我们可以论证，对于任何固定的丨，和 

- DGW + d ，以至多 1/((2^ - lh 2 ) 的概率为负。（习题42包含其细节。）由 

此得出 ，尺 /((2*- l ) s 2 ) 是在步骤 L 3 中： r (0) 非负的概率的上界。 

定理 G 如果 s = E ((_ l ) GU) + n ) > o 且 2* >「2尺/5 2 "|，娜算法乙以大于等于 
112的概率输出 x 。 运行时间是 0( k 2 k R ) 加上对 G 做 2 k Rf 计算的时间 。 i 
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现在我们已经做好了证明等式 3.2.2-( 17) 的平方搅混序列是（拟）随机数的一 

个好的来源的准备。假设其中 P 和 Q 是分别在范围 2 (r - 2)I2 
< p <2 a - u /2, 2 W 2 < Q<2 a + 1) /2 中形如4^+3的素数。我们将称 M 是一个只个 

二进位的 Blum 整数。因为这样的数对于密码学的重要性首先是由 Manuel Bkim 指 
出的 [COMPCON 24 (1982 年春），133〜 137] 。 Blum 原来提议， P 和 Q 两者都有只/ 
2个二进位，但是算法 4.5.4 D 表明，最好是如这里所述选择 P 和 Q ， 使得 Q ~ P > 

.29x 2 r/2 0 

在 OSXo ' M 的范围内随机地选择且丄也设 Z 是一个随机的尺个 

二进位的屏蔽。通过设 X 是对于作为 （ X D ， Z ， M ) 的可能性的所有 U ， z ，”2) 的集 

合，并且加上进一步的限制，即对于某个 a (modulo m )， 我们可以构造一个 

迭代的 IV 源 S 。容易证明函数 g 2， m ) = (: r 2 mod w ， z ， m ) 是 X 的一个排列 

(例如，请见习题4.5.4-35)。在这个迭代的源中抽取二进位的函数 
x-z mod 2。我们的初始值 （ Xo , Z ， M ) 不必在 X 中，但 g ( 义， Z ， iU ) 是在 X 中一 

致分布的 ，因为 恰好有4个 Xq 的值有一个给定的平方 mod M 。 


定理 P 设 S 是在 R 个二进位的模上由平方搅混方法定义的 N 源，并假设 S 不 
能通过带有容差的某个统计检验 A。 于是我们可以构造一个这样的算法 F ， 
它找出有上面所描述的形式的随机 R 个二进位的 Bhim 整数 M = PQ 的因子，而且 
其成功概率至少为 J (4 N )， 其运行时间为 T ( F ) = 0( N 4 2 r 2 T ( A ) + N 3 i ^ — 2 )。 

证明乘法模 M 可以在 OCR 2 ) 步内 完成； 因此丁 (/) + 丁 （ g ) = 0( 只 2 )。因此 
引理 P 4 断言带有成功率 ViV 的一个猜测算法 G 的存在性且 T ( G )< T ( A ) + 
0( iVi ^ 2 )。 利用习题41的方法我们可以由 A 构造 G 。 这个算法 G 有这样一个性 

质，即 5 = E (( - l ) G( ^ z,m) + 2r *")Xy + ^/ N ) 一 （ 士- JN ) =2" N ， 其中期望值是对 

所有 （： c ，2；， m )6 X 取的，且其中（: y ，2：， m ) = g (: c ， z ， m )。 

所要求的算法 F 进行如 下：给 定一个随机的 M = PQ ， 且 P ， Q 是未知的，它在 
0与 M 之间计算一个随机的 X Q ， 而且如果 gcd ( X 0 , M )^ l 就以一个已知的因子分 

解立即停止 。 否则它以 G(z) = G ( X 2 0 mod Mj ， iVO 和々 =「 lg(l + 2 N 2 i ^ 2 )"| 应用 

算法 L 。 如果通过该算法所产生的 Y 个值: r 的输出之一满足: r 2 EX 〗（ mc ) dul 0 M ), 
则 x X 0 的机会是50: 50;于是 gcd ( X 0 - : r ， M ) 和 gcd ( X 0 + : r ， M ) 都是 M 的 

素因子。（请见 4.5.4 小节中 Rabin 的 “SQRT 盒”。） 

由于 — \因此这个算法的运行时间显然是 O ( N 2 R 2 r 2 T ( A ) + 

N 3 R A r 2 ) o 它在对 M 进行因子分解中获得成功的概率可以估计如 下：设 n 二 
\ X \ I 2 r 是对 U ， m ) 进行选择的次数，并设5_=2-^2( - 其中求 

和是对于所有只个二进位的数2进行的；于是5= T ^， m s x Jn >2 jN 。 设 t 是使得 

的 U ，770 的个数。我们的算法处理这样的数偶的概率是 



n 
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努 -2 [〜時>点 

x , m 

而且在这样一种情况下由定理 G 它以大于等于1/2的概率找到： r ， 因为我们有 2 k > 
「2只 / sU ; 因此它以大于等于1/4的概率求出一个因子。 ■ 

从实用的观点看，定理 P 意味着什么呢？我们的证明显示，由0所蕴涵的常数 
是很 小的； 让我们假定进行因子分解的运行时间顶多为 10( N 2 i ^ 2 r 2 T ( A ) 十 
n 3 r \~ 2 ) 0 世界上许多最伟大的数学家都已经在从事对大的数进行因子分解的研 
究，特别是在20世纪70年代末期发现因子分解同密码学高度相关之后。由于它们 
还未找到一个好的解答，我们有充分理由相信因子分解是很难的；因此定理 P 将表 
明，对于探测平方搅混二进位的非随机性来说， T ( A ) 对于所有算法都是很大的。 

长的计算可以方便地以机器指令年 （ MIP 年）来度量，即由每 Gregorian 秒执行 
百万条指令的一台机器每 Gregorian 年执行的指令数，这个数即31 556 952 000 000 
〜 3.16 X 10 13 。 1995年，利用最高性能的算法分解一些120个十进位（即400个二 
进位）的数，要花费多达250机器指令年以上。如果发现一个算法，当只—〜时，它 
只要求 exp (尺 1/4 ( l nj R ) 3 M ) 条指令，则从事因子分解的最乐观的研究者们将会大吃一 
惊。但是让我们假定，这样一个突破已经实现，因为至少对于尺个二进位的 Blum 
整数的一个不太小的因子是如此。那么我们就可在2 x 10 25 个 MIP 年内分解大约 
50 000个二进位 （15 000个十进位）的数。如果对于 R =50 000,通过平方搅混方法 
我们生成 iV = 1 000个随机二进位，而且如果假定，好到足以对50 000个二进位的 

Blum 整数的至少进行因子分解的算法必须至少运行2 X 10 25 MIP 年，定理 P 

告诉我们，每个这样1000个二进位的集合将通过随机性的所有统计检验，而其运行 

时间少于70 000机器指令年。没有这样的算法 A 将能以大于等于 f = ^ 的概率来 

把这样的二进位同真正随机序列区别开来。 

印象深刻吗？否。这样一个结果几乎不会令人感到惊 讶：因为当尺 =50 000时 
仅仅为了以和 M 来启动平方搅混方法，我们就需要确定大约150 000个真正 

随机的二进位。从这样一个投资我们当然应该能够得到1 000个随机位的回报！ 

但是一般来说，当 f ^时，在我们保守的假定下，这个公式变成 

T ( A ) 及 — 2 exp (只 1/4 (1—) 3/4 ) - NR 2 

当尺很大时， NR 2 项可以忽略不计。所以让我们设尺=200 000和 N = 10 1G 。 于是 
从约等于 3 K =600 000个真正随机的二进位，我们得到100亿拟随机搅混位，并且 
通过所有的统计检验。而所需要时间则少于 7.486 X 10 1 G MIP 年 = 74.86 吉 MIP 
年。对于 N = 10 13 和 R = 333 333,为探测任何统计偏倚所需要的计算时间增加到 
53.5 太 （10 12 )MIP 年。 

如果因子分解是不可解的，避免随机屏蔽 Z 的简单拟随机生成程序 3.2.2- 
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(16) 也可被证明通过对于随机性的所有多项式时间的检验（见习题 4.5. 4-13)。但 
是对更简单的方法已知的性能保证，要比平方搅混的性能保证稍微弱些；当前两者 
的关系是 0( iV 4 沁 — 4 bg ( Ni ^ — y ) 对定理 P 中的 0( N 2 R 2 r 2 )。 

每个人都相信对于尺个二进位的数，没有这样的因子分解算法，其运行时间是 
关于尺的多项式的。如果该猜测在一个更强的形式下成立，使得我们对于任何固 
定的匕都不能在多项式时间内对于只个二进位的 Bkim 数的哪怕是其 llR k 来进行 
因子分解，则定理 P 证明，平方搅混方法生成的拟随机数，能通过随机性的所有多项 
式时间的统计检验。 

以另外一种方式来表 述：如 果对于适当地选定的 N 和 K ， 你使用平方搅混方法 
生成随机二进位，那你将或者得到通过所有合理的统计检验的数，或者你获得发现 
新的因子分解算法的运气和荣誉。 

G . 概述，历史和文献 我们已经定义了一个序列所可能具有的若干不同程度的 
随机性。 

oo 分布的无穷序列满足很多期望于随机序列的有用性质，而且有一套关于 00 分 
布序列的内容充实的理论（后面的习题提出了 00 分布的若干重要的性质，它们是正 
文中还未提到的）。因此，定义 R 1 是随机性的理论研究的一个适当基础。 

00 分布6进序列的概念是由 Emile Borel 于1909年引进的。他实际上定义了 
( mj ) 分布序列的概念，而且他证明了几乎所有实数的^进表示对于所有 w 和々 
都是 j ) 分布的。他称这样的数对于基数6是完全 正规的 ，而且他非正式地表述 
了定理 C ， 但没有明确认识到它需要证明 [ Rendiconti Circ. Mat. Palermo 27 (1909)， 
247 〜271， §12]。 关于这个课题的精彩讨论，出现于他的名著 Leconssuria THeone 
des Fo net ions ，第 2 版 (1914) , 182 〜 216 中。 

实数 的⑺分布序列——也称做完 备等分布序列 ——的概念，首先由 N . M . 

Korobov 发表于 Doldady AkacL Na uk SSSR 62 (1948),21-22 的一篇笔记上。 Ko - 
robov 与他的同事们在 20 世纪50年代的一系列文章中十分广泛地发展了关于这种 
序列的理论 。 Joel N . Franklin 独立地研究了完备等分布序列，见 Math. Comp. 17 

(1963) ，28〜59。这是一篇特别值得注意的论文，因为它是由随机数生成的问题引 

起的。 L . Kuipers 和 H . Niederreiter 所著 Un;Yorm Distribution of Sequences (New 

York : W 〖 l ey ，1974) 是一本关于所有类型的々分布序列的丰富数学论著的非常完备 
的信息源泉。 

然而，我们看到， 00 分布序列并不一定要充分地杂乱才可以认为是“随机”的。 
上面描述的三个定义 R 4， R 5 和 R 6 都提供了附加的条件，特别是定义 R 6 看来是定 
义一个无穷随机序列概念的合适形式。它是一个同真正随机的直观概念完全相符 
的精确的定量陈述。 

从历史上看，这些定义的发展主要是受了 R-von M lses 探索“概率”的一个好定 
义的影响。 t±Math. Zeitschrift 5 (1919) ，52〜99中 ， von Mises 提出了 一个在想法上 
类似于定义 R 5 的定义，但这个定义太苛刻了（像我们的定义 R 3)， 以致不可能有满 
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足这些条件的序列存在。许多人注意到/这个矛盾， A . H . Copeland [ Amer . J . Math . 

50 (1928),535 〜 552] 建议，通过采用他称做“可允许的数”（或伯努利序列），来减弱 
von Mises 的定义。这些都等价于这样的⑺分布 [0 ，1 ) 序列，即对于一个给定的概率 
P ， 序列中所有元素 L 7„ 都已用 1( 如果 U n < /0或用 0( 如果 U „> p ) 代替。于是， 

Copeland 实际上是建议退回到定义 R 1 上。而后 Abraham Wald 指出没有必要如此 

急剧地减弱 v 0n Mises 的定义，他提出采用子序列规则的一个可数集合。在一篇重 
要的论文 [ErgebrJsse eines math . Kolloquiums 8 ( Vienna : 1937) ， 38 〜 72 ] 中 ， Wald 实 

际上证明了定理 W ， 但他做岀错误的论断说，对于所有勒贝格可测的 AG [0，1)， 由 
算法 W 构造的序列也满足更强的 条件： p r ( L /„6 A ) 等于 A 的测度。我们 已经发 


现，没有序列能满足这个性质。 

当 Wald 写他的论文时，“可计算性”的概念尚完全处于幼年时代，而 A . Church 
[ Bull . Amer . Math . Soc . 46 ( 1940) ， 130 〜 135] 说明了怎样可以把“能行算法”的精确 

思想加进 Wald 的理论中去，以使他的定义成为完全严格的。对定义 R 6 的推广实 
质上归功于 A . N . Ko [ mogorov[Sankhya A 25 ( 1963 )， 369〜376 ]，他同时提出 了对于 

有限序列的定义 Q2 。 关于有限序列随机性的另一个定义，它“介于”定义 Q1 和 Q2 
之间，早在许多年前就已为 S . Besicovitch 所阐述 [ Math . Zeltschrift 39 ( 1934 )， 146〜 

1561。 


Church 和 Kolmogomv 的著作仅仅考虑这样的二进序列，即对于一给定的概率 
/>，有1^(1 = 1) = 0。我们在本节的讨论，是稍微更一般的，因为一个[0，1)序列实 

际上一次就表不所有的 p。von Mises - Wald - Church 的定义已由 J . V . Howard 以另 
一 种有趣的方式所改进，见 Zeitschr . fiir math . Logik und Grundlagen der Math . 21 

(1975)，215 〜224。 

另 一 个重要的贡献是由 Donald W . Loveland . 做岀的 [ Zeitschr . fiir math . Logik 
und Grundlagen der Math . 12 (1966)，279 〜 294] ，他讨论了 3 定义 R 4， R 5， R 6 和若干 

中间概念。 Loveland 证明了存在不满足 R 4 的 R 5 随机序列，由此确定了需要像 R 6 
这样更强的定义。事实上，他定义了一个稍微简单的非负整数排列 〈/( rz )> 和类似 
于算法 W 的算法 W \ 使得当给出一个子序列规则的无穷集合时，对于由算法 

产生的每一 R 5 随机序列， 



尽管定义 R 6 直观上比 R 4 强得多，但是要严格地证明这一点显然不是一件简 
单的事，而且若干年来关于 R 4 是否蕴涵 R 6 —^直是未解决的问题。最后 Thomas 
Herzog 和 James C . Owings , Jr . 发现了怎样构造满足 R 4 而不满足 R 6 的一大类序列 
[见 Zeitschr . fiir math . Logik und Grundlagen der Math , 22 ( 1976) ， 385 〜 389] 。 

Kolmogorov 写了另一 ^ 篇重要的文章 [_Rroblemy Peredaci Informatsii 1 ( 1965 ) , 3 

〜 11]， 其中，他考虑了定义一个序列的“信息内容”问题，而这一工作促成了 Chaitin 
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和 Martin - Loff 通过“无模式性”来给出有限随机序列的有趣定义[见 IEEE 
Trans . IT - 14 ( 1968) ，662 〜 664] 。 这 一 思想 也可以追溯到 R . J . Solomonoff , Infor ¬ 
mation and Control 1 ( 1964) ， 1 〜 22 ， 224 〜 254 Trans . IT - 24 (1978)，422 〜 

432; J . Camp . System Sci . 55 (1997 ) ， 73 〜88。 

关于随机序列的哲学讨论，见 K . R . Popper , The Logic of Scientific Discovery 

( L on don ，1959)， 特别是 162 〜 163 页上的有趣构造，是他在1934年首先发表的。 

关于随机序列与递归函数之间的进一步联系，已由 D . W . Loveland 所剖析，见 
Trans . Amer . Math . Soc . 125 ( 1966 ) ， 497 〜510。也见 C . - P . Schnorr [ Zeitschr . 

Wahr . verw . Geb . 14 (1969)，27 〜 35] ，他发现随机序列和由 L . E . J . Brouwer 在 1919 
年定义的“测度 0 类”之间的强烈关系。 Schnorr 随后的书 Zufalhgkeit 

und Wahrscheinlichkeit [Lecture Notes in Math . 218 ( Berlin : Springer , 1971)] 给出了 

关于随机性的整个问题的详尽讨论，而且对这个课题的一直增长着的最新文献也做 

了 出色的介绍。李明和 Paul . M . B . Vitanyi 在 An Introductien to Kolmogorov Com - 
plexity and Its Applications ( Springer , 1993) — 书中，对于此后的 20 年间的重要发展 

做了综述。 

Manuel Blum ， Silvio Micali 和 Andrew Yao[FOCS 23 (1982) ， 80 〜 91 ， 112 〜 117; 

SICOMP 13 (1984) ,850 — 864] 奠定了拟随机序列和有效信息理论的基础。他们构 
造了通过所有能行的统计检验的明显序列。 Blum 和 MicaH 引进了“硬核二进位”的 

概念，即使得/(：0和都可容易地计算（尽管 / U [ _ 1] (： r )) 却不）的布尔函数 
/;他们的论文是引理 P 4 的起源 。 Leonid Levin 进一步发展了这一理论 [ Cambina - 
torica 7 (1987) ，357〜 363] ，而后他和 Oded Goldreich[STOC 21 (1989) ，25〜 32] 分 

析了诸如平方搅混这样一些算法并说明对一个屏蔽的类似使用在许多进一步的情 
况中产生硬核二进位。最后 LevinL /. Symboik Logic 58 (1993) ，1102〜 1103] 通过引 

进和分析算法 L 从而改进了该篇论文的诸方法。 

许多作者都对这个理论做出了贡献-他们主要有 Impagliazzo , Levin ， Luby 以 


及 H ^ stad ， 他们证明 [SICOMP 28 (1999) ，1364〜 1396] 拟随机序列可以由任何单 
向函数构造岀来——但这里不讨论这样一些结果，因为他们主要是用于抽象理论而 
不是实际的随机数生成。关于拟随机数性的理论工作在实践中的含义首先是由 P . 
L’Ecuyer 和 R . Proulx 从经验上进行研究的，见 Winter ConL 22 (1989)， 

467 〜476。 

If the numbers are not random f 
they are at least higgiedy - piggledy• 

如果这些数不随机， 
他们至少是杂乱无章的。 

—GEORGE MARSAGLIA (1984) 
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习 



1 . [ 10 ] 一个周期序列能是等分布的吗？ 

2 . [ 10 ] 考虑周期的二进序列0,0，1，1，0,0，1，1，…，它是1分布的吗？是2分布的吗？是3 
分布的吗？ 

3 . [ M 22 ] 构造一个3分布的周期三元序列。 

4 . [ HM 14 ] 对于任意两个命题 SU ) 和 T ( n )， 假定极限 Pr ( S ( n ) 且丁 U ))， Pr ( SU ：^ 
: TU ))， Pr ( S ( n )) 和 Pi : (丁 （ n )) 中至少有三个存在，试证明等式 Pr ( SU ) 且丁 U )) + P r ( S ( n ) 或 
: TU )) = P r ( S ( n )) + (丁 （ n )) 成立。例如，如果一个序列是2分布的，则我们将求得 

Pr ( u 1 ^ U ri <C ski ^2 ^ ^n +1 ^ 2 ) ~ 

+ V 2 - u 2 - (v [- U- i )(v 2 - u 2 ) 


► 5. [ HM 22] S = (2 Llg 卜 + 1) 」/3) mod 1. ，问 Pr ^ 



6.[ HM 23] 设 SjnhS / n )， …是一个关于互不相交事件命题的无穷序列，即如果则 
S ; . U ) 和 S ; ( n ) 不能同时为真。假设对于每一 f _;_> l ， Pr ( S , U )) 存在。 证明： 丘(对于某个_;>1， 
$.(77)为真）>1：, >1 ?4&( 7 1))，并给出一个例子来说明等式不必成立。 

l .[ HM 27] 设 | S “ tOI 是对于所有 i ， J >\ 使得 Pr ( S v .( rz )) 存在的一族命题。假定对所有的 
«>0，\(^)恰巧对于一对整数为真。如果 SqyPKS . U )) = 1，则能否得出 结论： 对于所 
有的 zSUPKS〆 ”） 对某个为真）存在并且等于 Sp / KSdU ))? 

8. [ Ml 5] 证明（13)。 

9. [ HM 20 ] 证明引理 E [ 提示：考虑 S / MU ,, _ a ) 2 ]。 

► 10. [ HM 22] 在定理 C 的证明中， m 整除 9 这一事实用在什么地方？ 

U .[ M 10] 用定理 C 证明：如果一个序列 〈 UJ 是 oo 分布的，则子序列 〈 L / 2 J 也是。 

12. [ HM 20] 试证々 分布序列在下列的意义下通过“々的极大值”检验： 

Pr ( w ^ max ( U , } , U n + ] ，…， U )t + k _、）< v ) = v k _ u k 

► 13.[ HM 27] 试证在下列意义下一个⑺分布 [0，1) 序列通过“间隔检验”：如果且 
广=/?-心则命/(0)=0，而且对于”>1，命 / U ) 是使得的最小整数 mO > f(n - 

1))，于是 n - l )^ k ) = p (\- p) k - l o 

14 . [ HM 25 ] 试证在下列定义下一个 w 分布序列通过“运行检验”：如果/(0) =0而且对于 
”> l ，/( n ) 是使得 U ,„ - , > U r/I 的最小整数 m ( m>/U -1))，则 

Pr( /(n ) -f{n -1) = k) = 2kj{k + 1) ! - 2(k + \ )l (k + 2) ! 


► 15. [ HM 30] 试证在下列定义下一个⑺分布序列通过仅有两类赠券时的“集券检验 ”：设 X 


X 


是— 个⑺分 布序列。令/(0)=0,而且对于77>1，令 / U ) 是使得 jX / 


(；?—!)+ 1 


是集 


合10, il 的最小整数 m ( m >/(/2 - 1))。证明对于 々>2， PK / U ) -/(n -1) = 0 = 2^( 参见习 


题 7) o 

16 . [ HM 38 ] 当有两类以上的赠券时，集券检验对于^分布序列是否成立？（参考上题。） 

17. [ HM 50 ] 如果 r 为任何给定的有理数， Franklin 已经证明，序列 〈 r ” mod 1>不是2分布的。 
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但是有没有有理数 r 使得这个序列是等分布的呢？特别是，当 r = | 时，这个序列是等分布的 

吗？[参考 K. Mahler yMathematika 4 (1957) ，122 - 124。] 

► 18. [HM 22] 证明 ：如果 ，…是々分布的，则序列 Vq ，％ ，…也是々分布的，其中％二 
， nU n il n 。 

19. [ HM 35] 考虑对定义 R4 的这样一个修改，它要求子序列仅是“1分布”，而不是“〜分布” 
的。有无满足这个较弱定义的一个序列，但它却不是〜分布的？（较弱的定义是否真正较弱？） 

► 20.[HM36](N.G.de Bruijn 和 P, Erdds ) 任何有 U 0 = 0 的[0, 1) 序列〈的头 n 个点把区间 


[o,i) 分成”个子 区间； 设这些子区间有长度 OO … 显然，因为 

n 

#+…测量 〈 u,,> 的分布的相等性的一个方法是考虑 

L = lim sup 和 _L = lim inf 

n 00 )i ^ 

a) 对于 van der Corput 序列 （29) 说来，什么是 L 和乙？ 

b) 证明对于 l<々<n 利用这一结果来证明 r> l/ln 2。 

c) 证明 L<1/ In 4。[提 示：对 于每个77,有数〜，…，使得对于1<々<2心以) 人 

k 

而且，在，…， a 2 ，, 丨中每个整数 2,…， n 至多出现两次。] 

d) 证明对于所有的〜由 W fl = \ g (2 n + 1) mod 1所定义的序列〈>满足1/ In 2> nt [ l) > 

ln4。 因此它实现最优的 I 和 L。 

21 . [ HM 40 ] (L. H. Ramshaw) 

a) 继续上一■题，序列〈 W\, 〉是等分布的吗？ 

b) 证明 〈W ，,> 是惟一这样的[0，1)序列，对于它，每当时，我们有 

S" J\P < IgO + kjn ) 

J 一 i 

C )"®〈/r7(^l ，…， L)〉 是在《元组 I Ul ，…乂 ,）I … > l n 和 / l 十… = 1 1 的集合上的连续 
函数的任何序列，且满足以下两个性质： 


fm 




m 




丄/ ■ 





若对于 则 A(/i，O 。 [例子是 一 ”/(/‘）; 

+…+ Z 卜 2 )。]设对于序列〈 WJ， 

F = lim sup 人 （ / (” 1 )，…，/ (/)) 

，，一 ► Oo 

证明对于所有的 n ，相对于〈 WJ ，人 （ /。 ，…， /卜 ） 而且相对于其它每个 [0 ，1 ) 序歹 IJ ， 

lim su P ， 7 —oo 

► 22. [HM30](Hermann Weyl) 证明 [0 ， 1) 序列〈 U„ > 是々分布的充分必要条件是 ：对于 每一组 
不全为0的整数 Ci k 2 ，…，以， 


lim 

jV—► oo 


N 



exp(27 ri(Ct U 


yi 




+ c k U )1 + k ^)) = 0 


23. [ M 32] ( a ) 证明每当 q ， c 2 ，…， q 是不全为苓的整数时，当且仅当所有序列 
(( C 1 U „ + c 2 L /„ + 1 +…+ qL /„ + 〖） mod 1〉是1分布时， [0 ，1 ) 序列〈[/々〉是6分布的。 （ b ) 每当 
q ， c 2 ，…， q 是整数且 gcd ( c , , c 2 , ^ 1时，当且仅当所有序列〈（ qX ，, + C2 & + t +…+ 

cA + ^_,) mod 6>是1分布时，一个6进序列 〈 XJ 是々 分布的。 
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► 24. [ M 35 ]( J . G van der Corput ) ( a ) 证明每当对于所有的々 >0，序列〈（ U „ + k - U }1 ) mod 1〉是 

等分布时，[ 0 ， 1 )序列〈[；，,> 是等分布的。 （ b ) 因此，当 d > 0 和〜是无理数时，〈（& 〆 +〜 + &« + 
a 0 ) mod 1 〉是等分布的。 

25. [ HM 20 ] 如果所有的顺序相关系数均为0,即，如果对所有々> 1 ，推论 S 中的等式均为真， 
则说一个序列是“白序列”（由推论 S ， 一个^分布序列是白色的）。证 明：如 果一个[(^:^序列是等 
分布的，则它是白色的充要条件是 


im 



n 



U 


0^j< 


2 




对所有纟 > 1 


26^ [ HM 34]( J . Franklin ) 像上题所定义的那样，一个白序列可以完全不是随机的。设 L / Q ， 


LA ，…是一个 oo 分布序列，定义序列 V Q ， ，… 如下： 

( V 。— 1 ， ） 二 ( ^2 n-l y ^2 n ) 如果 — I ，％") G G 


(^2 ^ - 1 ^2 ；/ ) = (以 2 »，以 2 ”- 1 ) 如果 （ Rn — 1 ， S G 


其中 G 是集合 |(_ r ，： y)| 1 r — 或 : c + ^-^ 3 ； | 。 


证明 ：（ a ) Vq ， ％，…是等分布的和白 色的； （ b ) Pr ( V ，,> V ，, + 1 ) = ^ ■(这指出序列相关检验的 
弱点）。 

27 . [ HM 48 ] 在一个等分布的白序列中， PKV ,〉 ％ + 1 )的最高可能值是多少？ [ D . Copper ¬ 
smith 已经构造了一个这样的序列，并取得了值 7 / 8 。] 


► 28. [ HM 21 ] 用序列 （11) 来构造3分布的一个[0，1)序列，使得 U 2n >^ 
29 . [ HM 34 ] ，…是一个（2々）分布序列，证明 



3 


4 


► 30. [ M 39] 构造一个 (20 分布的二进序列，并使得对于它 Pr ( X 2 , i =0) 二 
(因此，上题中的不等式是最好的）。 



31. [ M 30] 试证： 存在满足定义 R 5 的一个[0，1)序列，而且对于所有的；7>0，〜/«>士，其中 

K 是使得士的非负整数 ） G < n ) 的个数（这可以认为是序列的一个非随机性质）。 

32 . [ M 24 ] 令是按照定义 R 5 为“随机”的一个6进序列，而且4是确定一无穷子序列 
( X „)^ 的可计算子序列规则，证明该子序列不仅是1分布的，而且按定义 R 5 它是“随机的”。 

33 . [ HM 22 ] 设 < L/ r ) m ( U s >是一个序列〈[；„>的无穷不相交子序列（于是以< ri < ~ 〈…和 

n )i 

5 0< h < s 2 <〜 都是整数的递增序列，而且对于任何设 〈认 〉是组合成的子序列, 

71 

它使得~ 〈… ，并且使集合 I G 1 = I r ” ！ U 丨 。 试证：如果 Pr ( L/ r ^ A ) = Pr ( U s € A ) ^ 

n ' n 

p ， 则 Pr ( U , = 

n 

► 34. [ M 25] 定义子序列规则，…使得借助这些规则可以使用算法 W ， 以给出一个 
能行算法来构造满足定义 R 1 的[0，1)序列。 

► 35 . [ HM 35 ] ( D . W . Loveland ) 证明 ：如果 一个二进序列< X ，,〉是 R 5 随机的，而且如果是如 
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同定义 R 4 中那样的任何可计算序列 MMX Sii = ：0>+且 Pr ( 士。 

36. [ HM 30] 设〈 X ，,〉是按照定义 R 6 为“随机”的一个二进序列。试证，按照方案 U Q = 
( O . X 0 ) 2 , U 1 = (0^^ 2 ) 2 , U 2 = ( O . X 3 X 4 X 5 ) 2 , U 3 - ( O . X 6 X 7 X 8 X 9 ) 2 , … 

在二进记号下定义的 [0，1) 序列 〈 U ，,〉 在定义 R 6 的意义下是随机的 c 

37. [ M 37]( D . Coppersmith ) 试定义满足定义 R 4 但不满足定义 R 5 的一个序列。[提示：在一 

个真正的随机序列中考虑改变…。] 

38. [ M 49]( A . H . Kolmogorov ) 给定 N ， n〆 和算法集合 A ， 使得相对于 A 不存在长度为 N 的 

U〆 ） 随机二进序列的 A 中算法的最小个数是多少（如果不能给出精确的公式，能否找到渐近公 

式？问题的要点是去发现界 （37) 如何接近于成为“最佳可能的界”） 9 

31 [ HM 45]( W . M . Schmidt ) 设 U ，, 是一个[0，1)序列，并设 〜 U ) 是使 〈“ 的非负整 

数只7<幻的个数。证明有一个正常数 c 使得对于任何 N 和任何[0，1)序列 〈 L T n 〉， 对于满足 

< N ,0^ w < 1的某个 n 和 w 有 

| v n { u ) - un > c In N 

(换句话说，没有[0，1)序列可能是太等分布的。） 

40 . [ M 28 ] 完成引理 P 1 的证明。 

41. \_ M 21 ] 引理 P 2 证明一个预测检验的存在性，但它的证明依赖于一个适当的々的存在性， 
却没有说明我们如何可以从 A 构造性地求出々。试证明任何算法 A 都可能转换成这样一个算法 

A ， ，且有 Ti ^ XTiA ) + O ( JV ): 对于任何移位对称 N 源 S ， 它以至少为 | 十 （ P ( A ， S ) _ 

P ( A ，$ N )/ iV 的概率从预测 B n 。 

► 42.[ iW 2 S ] (成对独立性） 

a ) 设&，…，\是对于 l < j < n 有均值 " =E \和方差 < t 2 = E X)_(E \) 2 的随机变童，在 
下列附加假定，即每当•时 E ( X , X ,) = ( EX ,.)(£&) 之下，证明切比雪夫不等式 

Pr(d 十 … + X n - nfi ) 2 ^ tna 2 ) ^ lit 

b ) 设 B 是一个随机的 AX R 二进矩阵。证明如果 c 和 〆 是固定的非零々个二进位的向量，且 
c 关 ，，则 向量 cB 和， B 是独立随机只个二进位向量（模2)。 

c ) 应用 a ) 和 b ) 到算法 L 的分析上。 

43. [20 ] 看起来求任何固定的 R 个二进位 Blum 整数 iVT 的因子和求一个随机的只个二进位 
整数的因子一样地难。那么为什么定理 P 是对随机的 M 而不是对固定的 M 论述呢？ 

► 44. [ i 6]( I . J . Good ) 一张正确的随机数字表能仅含一个印刷错误吗？ 

3.6 小结 

在这一章中我们叙述了相当大量的课题：怎样生成随机数，怎样检验它们，怎样 
在应用中修正它们，以及怎样推导关于它们的理论等。也许在许多读者的心目中， 
主要的问 题是： “什么是整个理论的结果？什么是在我的程序中可以使用的简单而 

良好的生成程序，以便有一个可靠的随机数的来源？” 

这一章中的详细研究表明，下列过程给出了对于大多数计算机的机器语言来说 
是“最好”和“最简单”的随机数生成程序：在程序的开头，把一个整型变量 x 置为某 
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个值 X Q 。 变量 X 仅用于随机数生成的目的。每当程序要求一个新的随机数时，即 

置 

X ( aX + c ) mod rn ( 1 ) 

并且使用 X 的新值作为随机值。应该适当地选择 X 0 , ^ , C 和 m ， 而且按下列原则 
明智地使用随 机数： 

( i ) “种子”数可以任意地选择。如果这个程序运行若干次，而且每次都希 
望有不同的随机数来源，则置为上次赋予运行中由 X 得到的最 后值； 或者（如果 
更方便的话）置 X Q 为当前的日期和时间。如果这个程序以后可能要以同样的随机 
数重新运行（例如当调试时），而又不知道的值是什么，就应该打印出来看看。 

( ii ) 数 m 应是大的，比如说至少是 2 3 Q 。 取计算机字的大小可能是方便的，因为 
这会使 UX + c ) mod m 的计算十分高效。 3.2. 1. 1小节更详细地讨论了 m 的选 
择 。 (aX + (f ) mod m 的计算必须精确，不带舍去误差 3 

( m ) 如果 m 是2的一个乘方 （ g 卩如果正使用一台二进制计算机），则可挑选 a 
使得 a mod 8 = 5。如果 m 是10的一个乘方（即如果正使用一台十进制计算机），则 
可选择 a 使得 a mod 200 = 21。 a 的这一选择和以下给出的 c 的选择一起，保证了 

这个随机数生成程序在它开始重复以前，产生 X 的全部 m 个可能的不同值（见 
3.2.1.2 小节）以及保证了高的“效能”（见 3.2.1.3 小节）。 

( iv ) 乘数 a 选择在 .01 m 和 .99 m 之间是可取的，而且它的二进表示或十进表 
示数字不应有一个简单的正规的模式。通过选择某些像 a = 3141592621这样的任 
意常数（它同时满足（山）中的两个条件），几乎总能得到相当好的乘数。如果要广泛 
使用这个随机数生成程序，当然应该做进一步的 检验； 例如，当使用欧几里得算法来 
求 a 和 m 的 gcd (见 3.3.3 小节）时，不应有太大的商。在乘数被认为真正合格之前 
它应通过谱检验 （3.3. 4小节）和 3.3.2 小节的若干检验。 

( v ) 当 a 是一个好的乘数时，除了当 W 是计算机的字的大小时不能和 m 有公 
因子外， c 的值是无所谓的。因此我们可以选择 C = 1或 c = a 。 许多人已经把 c =0 

和 m 放在一起使用，但它们牺牲两位精度和一半的种子值，却只不过节省了几 

纳秒的运行时间（请见习题 3.2. 1.2-9)。 

( vi ) X 的最低位（右边）数字不是非常随机的，所以以数 X 为基础的判定总是 
主要受最高位的影响。 一 般说来，最好是把 X 当做0与1之间的随机分数 X / 772 ,gP 
假定在 X 的左边有一个小数点，而不把 X 看做0与 m - 1之间的一个随机整数。 

为了计算0与 A - 1之间的一个随机整数，人们应该乘之以 I 并截取这结果的整数 
部分（不要除以 I 见习题 3.4. 1-3)。 

( vii ) 3.3.4 小节中讨论了关于序列 （1) 的随机性的一个重要极限，其中证明了 

在 t 维中的“精度”大约仅是^中的一部分。利用 3.2.2 小节中所讨论的一些技 
术，要求较高分辨率的蒙特卡罗的应用可以改进随机性。 

( viii ) 至多应生成大约 m /1000 个数，否则未来的特性将越来越像过去 那样； 如 
果 m =2 32 , 这意味着在消耗了几百万个随机数之后应该釆取一个新的方案（例如一 
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个新的乘数 a )。 

上述评述主要适用于机器语言的编码。对于程序设计来说，某些思想在高级程 

序设计语言中也很有效；例如，如果 X 是 unsigned long 类型的而且 w 是 unsigned 

lcmg 类型的算术运算的模数（通常是2 32 或2 64 )，则在 C 语言中 （1) 就变成 “ X = a*X 
十 c ”。 但 C 语言不像上面的 （ vi ) 中所要求的那样，为我们提供把 X 当做一个分数的 


好方法，除非我们转换成双精度的浮点数。 

因此 （1) 的另外的形式经常被用于像 C 这样的语言当中•.我们把 m 选择成一个 
接近易于计算的最大整数的素数，而且令 a 是 m 的一个 原根； 此种情况的适当增量 
c 是零。于是 （1) 可以利用习题 3.2.1.1-9 的技术，通过对保持在_ m 和+ m 之间 
的数的简单算术运算完全地实现。例如，当 a =48271 和 m = 2 32 _ l ( 见表 3.3.4-1 
中的行20)，我们可以下述的 C 程序计算 X—aX mod m ： 

# define MM 2147483647 / * 一个梅森素数 * / 

# define AA 48271 / * 这在谱检验中干得很好 * / 


井 define QQ 44488 / * MM/AA * / 

并 define RR 3399 / * MM % AA ; 重要的是 RR< QQ * / 

X = AA* (X % QQ) _ RR * (X/QQ); 


if ( X <0) X += MM ； 

这里 X 是 long 类型的，因此 X 应该被初始化为小于 MM 的一个非零种子值。由于 MM 
是素数， X 的最低有效位和最髙有效位一样随机。所以不再需要采取 （ vi ) 的预设措 


如果需要数以亿计的随机数，可以通过写类似于下面的附加的代码，如同在等 
式 3 . 3 . 4 -( 38 ) 中那样，把这个程序同另一个程序组合在一起。 

# define MMM 2147483399 / * 一个非梅森素数 * / 

^define AAA 40692 / * 另一^个谱检验的成功故事 * / 


# define QQQ 52774 / * MMM/AAA * / 

# define RRR 3791 / * MMM % MA ; 再次小于 QQQ*/ 

Y = AAA * (Y % QQQ) - RRR * (Y/QQQ) ; 


if (Y<0) Y += MMM; 

Z = X - Y ； if (Z<= 0) Z += MM; 

和 X —样，变量 Y 开始时需要是非零的。这个代码稍微偏离 3.3. 4-(38)，使得输出 Z 
总不 为零； Z 总是严格地处于0和 2 31 之间。 Z 序列的周期长度大约是 74 X 10 24 ,因 


此它的数字的精度差不多是 X 的数字的精度的两倍。 

这个方法是可移植的而且相当简单，但不是很快的。基于延搁斐波那契序列和 
减法（习题 3.2.2-23) 的另外一个方案是更吸引人的，因为它不仅允许在计算机之间 
的可移植性，而且它要快得多。它还派送质量更好的随机数，因为对于〖<100来说 

t 维精度大概是好的。以下是一个 C 子程序 raw — array (lonq aa [] , int n ) ，它使 


用递推式 
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Xj 二 ( Xj^iqq — X 广 37) mo d 2 30 (2) 

生成” 个新的随机数并且把它们放在一个给定的数组⑽中。这个递推式特别适合 
于现代计算机。 n 的值必须至少是100;建议使用像1000这样更大的值。 

# define KK 100 /* 长的延搁*/ 

# define LL 37 /* 短的延搁*/ 

# define MM (1L«30) / * 模数 * / 

# define raod_ diff (x, y) ( ( (x) - (y) )&(MM - 1) ) / * (x- y)mod MM * / 

long ran_x[KK] ； / * 生成程序状态 * / 

void ran_array(long aa[] ,int n) | / * 生成 n 个新的值放人 aa 中 * / 


register int i ， j; 

for (j =0 ； j<KK；j + + ) aa[ j ] = ran — x[ j ]； 


for ( ； j<n；j ++ ) aa[j] = mod - diff (aa[ j - KK] ,aa[ j - LL ])； 

for (i = 0;i<LL;i+ + ,j + + ) ran _ x[ i ] = mod _ diff (aa[ j - KK ] , aa [ j - 

LL ])； 

for ( ； i<KK ； i+ + ,j + + ) ran 一 x [ i ] = mod— diff (aa [ j - KK ] ， ran _ x[ i - 

LL]) ; 

I 

所有通过未来对 ran _ array 的调用而将生成的关于数的信息都出现于 m/2 _ x 

中，所以如果要在以后的某个时候重新启动而不必全程跑回到这个序列的开始处， 
你可以在一个计算的当中做这个数组的一个备份。当然，使用像 （2) 这样的一个递 
推式的技巧是通过建立适当的值…， X 99 ，首先使每件事情都适当地开始。当给 

定0和 2 3 Q -3= 1 073 741 821( 含）之间任何种子数时，下列子程序 ran - start (long 

) 能够很好地初始化生成 程序： 

# define TT 70 / * 保证流之间的分开 -》 / 

# define is_odd(x) ((x)&l) /*x 的单位的二进位* / 


void ran. start (long seed) { 


/ * 使用这建立 ran_ x * / 


register int t ， j ; 
long x[KK + KK - 1 ]； 

register long ss = (seed + 2) & (MM - 2) ； 
for (j = 0 ； j<KK；j ++ )| 
x[j] = ss ； 

ss<3C= 1; if (ss >= MM) ss - = MM - 2; 

I 

x[l] ++ ; 

for (ss = seed&(MM - 1) , t = TT - 1 ； t ； ) j 
for (j = KK - l ； j>0; j -― ) 

x[ j + j] = x[ j] ,x[ j + j - l] = 0; 


/* 预备缓冲*/ 


/* 缓冲自举* / 
/* 循环移29位*/ 

/ * 使 x [ l ] (且仅义[1])奇 * / 


卜“平方 ”*1 
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for (j = KK + KK - 2 ; j > = KK; j --) 

x[j - (KK - LL)] = mod_diff(x[ j - (KK - LL) ] ， x[ j ]) ， 

x[ j - KK] = mod_ diff (x[ j - KK] ， x[ j 」 ） ； 

if ( is _ odd ( ss) ) j / * “乘以 z ” * / 

for (j = KK ; j > 0 ; j -- ) x [ j ] = x [ j - l ]; 

x[0] = x[KK ]； 卜 循环移缓冲区 * / 

x[LL] = mod_ diff (x[LL] ,x[.KK]) ; 
if (ss) ss》=1 ；else t —— ； 

I 

for (j = 0;j<LL；j ++ ) ran _ x[ j + KK - LL] = x[ j ]; 
for ( ； j < KK ； j + + ) ran_x[ j _ LL] = x[ j ]； 

for (j = 0 ； j<10；j + + ) ran_ array( x , KK + KK - 1) ； /* 热身 */ 

1 

(本程序吸纳了 Richard Brent 和 Pedro Gimeno 于 2001 年 11 月提出的意见，对 

作者原来的 War 纟例程作了改进。） 

习题9中说明了 ran — start 有些奇怪的操作，它证明由不同起始种子生成的数 

的序列是彼此独立的:在 raw - array 白勺子序列输出中每 100 个连续值 X ;; , X ;; + ! , * * * , 

X n + 99 & 块将不同于通过另外的种子而出现的块。 (严格地说，仅当 n <2 7() 时才知 

道这是 对的； 但一年里也不过2 55 ns 。） 若干过程因此可通过不同的种子并行地开始 
并且应确保它们进行独立的 计算； 在不同的计算机中心工作在同一问题的不同科学 
家群体可以保证，他们不重复其他人的工作，如果他们把自己限定在不相交的种子 
组的话。因此单个的例程 ran _ array 和 ran _ siarf 提供了 10亿个以上实质上不相 

交的随机数组。而且如果这还不足够，你还可以从表 3.2.2-1 中选取其它值来代替 
程序参数100和37。 

为有效起见，这些 C 程序使用位的与操作“&”，所以它们并非严格地可移植的， 
除非计算机对于整数使用2的补码表示。几乎所有的现代计算机都是基于2的补 
码算术的，但是“&”对于这个算法说来并非真正必要。习题10说明不使用这样的 
技巧，怎样在 FORTRAN 中得到完全相同的数的序列。尽管在这里示出的程序被 
设计成生成30个二进位的整数，但也很容易把它们修改成生成在有可靠的浮点算 
术运算的计算机上的0和1之间的52个二进位的分数，请见习题11。 

你可能希望把 ran - array 包括在一个子程序库中，或者你可能发现已有另外 

某个人已经这样做了。检查 mrz _ army 和 ran _ start 的一个实现是否同上面给出 
的 一 致的 一 个方法是运彳了下列未完善的检查程序： 

int main() j register int m ； long a[2009 ]: 

ran_ start (310952); 
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for (m = 0 ； m<2009；m + + ) ran _ array(a , 1009 )； 
printf (" % Id \ n ’’ ， ran_ x[0 ])； 
ran_ start(310952) 

for (m=0 ； m<1009；m + + ) ran_ array(a ， 2009 )； 
printf ( " % Id \ n "， ran_ x[0 ] ) ; return 0 ; 

I 

打印输出应是 995235265( 两次）。 

告诫：由 ran - array 生成的数通不过3 . 3 . 2 J 小节中的生日间隔检验，而且它们 

还有其它一些缺点，这些缺点有时在高分辨率的模拟中出现（请见习题 3.3.2-31 和 
3.3.2-35)。避免生日间隔问题的一个方法是简单地只使用一半的数（跳过奇数编 
号的 数）； 但这并不解决其它问题。一个更好的方法是如同在 3.2.2 小节中那样，遵 
循 Martin Liischer 的建议：使用 ran - array 来生成，比如说1009个数，但只使用这 

些数中的头100个（见习题15 )。这个方法有适度的理论支持而且没有已知的那些 
缺点 。大多数用户将不需要这样的预防措施 ，但它 肯定地是较少风险的，而且允许 
在随机性和速度方面方便地折中。 

关于像 （1) 这样的线性同余序列已经知道很多了，但是关于像 （2) 这样的延搁斐 
波那契序列的随机性性质已经证明的东西相对要少些。在实际中这两个方法似乎 
都是可靠的，假如以已经论述的那些告诫来使用它们的话。 

当在20世纪60年代刚开始写本章时，在世界上大多数计算机上普遍使用称做 
RANDU 的真正可怕的随机数生成程序（请见 3.3.4 小节）。许多对于随机数生成科学 

做出贡献的作者通常不知道他们所使用的一些特定方法将被证明是不适当的 。一 
个特别值得注意的例子是 Alan M . Ferrenberg 和他的同事们在 Piiys / ca / Review Let ¬ 
ters 69 (1992)，3382〜3384上报告的经验 ：他们 通过首先考虑有一个已知答案的相 
关的二维问题，来检验对于一个三维问题他们的算法，从中发现，设想的高质量的现 

代随机数生成程序在第五个十进数位置中给出错误的结果。而形成对照的是，一个 
老式的历经磨炼的线性同余生成程序 X —16807 X mod (2 31 - 1) 却工作得很好。或 

许进一步的研究将表明甚至这里推荐的一些生成程序也是不能令人满 意的； 我们希 
望情况不是这样，但这个课题的历史警告我们要 谨慎。 对于每个人说来最谨慎的做 
法是在认真地采用程序的答案之前，至少再次使用十分不同的随机数来源，来运行 
每个蒙特卡罗程序•，这不仅给出对于结果的稳定性的一个指示，而且也防止信任有 
隐藏缺陷的生成程序的危险（每一个随机数生成程序至少将在一个应用中失灵）。 

关于随机数生成的文献，1972年以前已由下述人员编辑了很好的文献 目录: 

Richard. E. Nance 和 Claude Overstreet, Jr. ,Computing Reviews f 13 (1972) ,495 〜 
508 ;E. R. Sowey ^International Stat. Review 40 (1972),355 〜 371 。 1972 年一 1984 年 
期间则由 Sowey 作 / 报道， infamationa] Stat. Review 46 ( 1978 ) ， 89 〜 102; J. Royal 
Stat. Soc. A149 (1986 ) ， 83 〜 107 。随后的发展由 Shu Tezuka ' 在 L/niform Random 
Numbers (Boston ： Kluwer, 1995) 上作了讨论。 
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关于在数值分析中随机数的使用的详细研究，请见〗 . M . Hamersley 和 D . C . 

Handscomb , Monte Carlo Methods ( London : Methuen , 1964) 0 这本书说明，通过使 

用专门为某种目的设计的“亚随机”数（不必满足我们已经讨论的一些统计检验）可 

加强某些数值方法。 N . Metropolis 和 R . Eckhardt 在 Los Alamos Science 15 (1987)， 

125 〜 136的专集 Stan/siaw Ulam 1909 - ]984中，讨论了用于计算机的蒙特卡罗方法 
的起源。 

鼓励每一位读者都来做一做下面这组问题中的习题 6。 

习题 

1 . [2 i ] 用方法 U ) 写出一个具有如下特征的 mix 子程序： 

调用程序: JMP RANDI 

入口条件 ： rA = 幻一个小于50⑻的正整数 

出口 条件： - —个随机整数，而且每个整数是同等可能的 ； rX = ?;不考虑溢出 
► 2.[ i 5] 某些人害怕计算机将在某一天统治整个 世界； 但他们由于这样一个论点而放心了，即 
一台机器不能做任何真正新的事情，因为它仅仅服从于它的主人，即程序员的命令。 Lovelace 女 
士于1844年写到 ：“分 析机并不能主动做任何事情，它只能做 我们知道如何命令它 去做的 那些事 
情。” 她的论点已经进一步为许多哲学家所精心 推敲。 试从随机数生成程序的观点来讨论这一问 
题。 

3. [32] ( — 个骰子游戏） 写出一个程序，它模拟两个骰子的投掷，其中每一个以相等的概率取 
值1，2, …， 6。如果在头一次投掷时总数是7或11，则游戏 为胜； 总数是2,3或12 为败； 对于任何 
其它的总数，称该总数为“点”，然后继续投掷骰子，直至或者出现一个 7( 失败）或者再次出现点 
(胜利）。 

玩十次游戏，骰子每次投掷的结果应以 mn 形式打印，其中 m 和 n 是两个骰子的内容，后边再 

附加以适当的解释（比方说，“对幺”或“四点”或“对二”，等等）。 

4. [40] (单 人纸牌游戏） 有些人花费大量宝贵的时间来玩单人纸牌游戏，也许自动化将大量 
侵入这个领域。试写出一个程序 ： （ a ) 洗一副模拟的 纸牌； （ b ) 根据这副牌中纸牌的顺序，玩某种普 
通的单人纸牌 游戏； （ c ) 打印出这个游戏的结果，即怎样使这个程序以获胜结束。应该保持累计的 
统计数字，需要时要使程序能“作弊”。 

5. [46] (由 计算机实现创造性写作） 1960年10月26日哥伦比亚广播公司 （ CBS ) 电视网播出 

名为“思想机器”的一个电视节目（穿插在其它节目当中），连续放映了两场西方风格的独幕剧，它 

们是由一个计算机程序写成的。下边是用计算机打印出来的两个剧本。 

故事祛1 (枪在 右手； 钱在 左手； 破璃杯在桌子上•，瓶子在桌子上；手枪套在强盗身上，警长 

的枪在警长的右 手中； 警长的手枪套在警长的身上。） 

强盗 ：（ 强盗在窗户旁）走 向门；开门； 进门； 关门； 走到角 落处； 把钱放到角落处；走向桌子；把 
枪放在 桌上； 坐下，心情 烦躁； 坐在 桌旁； 右手拿起破璃杯（空的）；把破璃杯放在桌上；右手拿起瓶 
子；倒； 把瓶子放在桌上；右手拿起玻璃杯；举起破璃杯饮；把破璃杯放在桌上；右手拿起瓶子；坐在 
桌旁； 走向 角落； 走向 窗户； 走向桌边，把瓶子放到桌上；坐下，心情烦躁；坐在桌旁；坐着，心情烦 
躁； 走向 窗户； 走向 桌子； 右手拿起破璃杯。 

警长 ：（ 警长在窗户旁）看着 强盗； （强盗看着警长）；走向门 。 

强盗： 把玻璃杯放到 桌上； 右手拿起枪；检查枪。 


- 169 • 


第 3 章随机数 


警长：等候；开门； 看着 强盗； （强盗看着警 长）； 进门。 

强盗 ：走向窗户；瞄准；开枪； 警长躲过。 

警长 ：走向窗户；瞄准；开枪；未中； 走 向门； 走向窗户。 

强盗：走向门；瞄准；瞄准。 

警长：瞄准；开枪； 未中。 

强盗：开枪； 警长躲过。 

警 长：走向门；瞄准；开枪；未中；出门； 瞄准。 

强盗：瞄准；开枪； 未中。 瞄准；开枪； 未中。 

警长：开枪；未中； 走向 窗户；瞄准；开枪； 未中。 

强盗：瞄准；开枪；未中；瞄准；开枪；未中；瞄准；开枪；警长躲过。 

警长：瞄准；开枪；强盗中弹。 

强 盗：枪落地； 强盗死。 

警长 •.把 枪放入枪 套中； 走向 桌子； 右手拿起坡璃杯（空 的）； 把右手的玻璃杯换到 左手； 右手拿 
起 瓶子；倒； 把瓶子放到 桌上； 破璃杯从左手换到 右手； 举破璃 杯饮； 破璃杯从右手换到 左手； 右手 
拿起 瓶子；倒； 把瓶子放到 桌上； 玻璃杯从左手换到 右手； 举破璃 杯饮； 把破璃杯放到 桌上； 走向角 
落； 右手拿 起钱； 走向门； 过门； 关门；幕落。 


故事#2 (枪在 右手； 钱在 左手； 坡璃杯在 桌上； 瓶子在 桌上； 手枪套在强盗 身上； 警长的枪 
在警长的右 手中； 警长的手枪套在警长身上。） 

强盗 ：（ 强盗在窗户旁边）走 向门；开门；过门；关门； 走到 角落； 在角落处把钱 放下； 走向 窗户； 
在窗户旁把枪 放下； 靠着窗户 观望； 靠着窗户 观望； 走向 角落；数钱； 走向 桌子； 右手拿起破璃杯（空 
的）； 把破璃杯从右手换到 左手； 右手拿起 瓶子；倒； 把瓶子放到 桌上； 把破璃杯从左手换到 右手； 举 
玻璃 杯饮； 把破璃杯放到 桌上； 右手拿起 瓶子；倒； 走向 角落； 在角落处把瓶子 放下； 走向 窗户； 右手 
拿起枪；验枪；把枪放进手枪套；走向桌子，右手拿起坡 璃杯； 举破璃 杯饮； 走向 窗户； 在窗户旁把坡 
璃杯放下。 

警长 ：（ 警长在窗户旁）看着 强盗； （强盗看着警 长）； 走到门口。 

强盗： 右手从手枪套 取枪；验枪； 走到 门口；验枪； 在门口把枪放下。 

警长：开门； 看着 强盗； （强盗看着警 长）；过门； 走向窗户。 

强盗： 右手拿起枪。 
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警长 ：走到 桌旁。 

强盗：瞄准；开枪； 未中； 瞄准；幵枪； 警长 中弹； 吹 枪管； 把枪放进手枪套。 

警 长：枪落地； 警长死去。 

强盗 ：走到角落； 右手拿起 钱袋； 走到 门口；出门；关门； 幕落。 

小心阅读上面的剧本会发现，这里有高度激烈的戏剧场面。计算机程序仔细记住每个演员 
的位置，他手中的东西等等。演员所采取的动作是随机的，由某个概率 支配； 其中愚蠢动作的概率 
随演员喝过多少酒及在一次射击中他多少次没有射中而增加。研究上面的剧本应能推断出本程 
序进 一 ■步 的性质 D 

当然，甚至最好的剧本在它们上演之前也要重写，当一个没有经验的作者准备原始剧本时， 
尤其如此。下面是真实地用来演出的剧本。 

故事# 1音乐起。 

中景强盗通过小屋'子的窗户盯着看。 

特写强盗的脸。 

中景强盗进入小屋。 

特写强盗看见桌上的威士忌酒瓶。 

特写警长在小屋外边。 

中景强盗看见警长。 

远景警长在强盗肩膀对过的门口处，两人掏枪。 

中景警长掏枪。 

远景射击，强盗中弹。 

中景警长取钱包。 

中景强盗打着趔趄。 

中景强盗垂死挣扎。在试图向警长作最后的射击之后，倒向桌子。 

中景警长带着钱走出门。 

中景强盗的身体现在仍然倒在桌子上。摄影机摇回 。 （笑声） 

故事#2 音乐起。 

特写窗户。强盗出现。 

中景强盗带着两袋钱进入小屋。 

中景强盗把钱放在桶上。 

特写强盗——看见桌上的威士忌。 

中景强盗自己在桌边倒酒喝。数钱。笑。 

中景警长在小屋外边。 

中景掠过窗户。 

中景强盗通过窗户看警长。 

远景警长进入小屋，掏枪，射击。 

特写警长因中弹而痛苦地扭动。 

中景 /2 镜头中弹的警长摇晃着到桌旁去喝酒……摔倒死去。 

中景强盗带着钱袋离开小屋。" 

[说明:近景= CS = “close up ” ，中景= MS 二 “medium shot ” ，等等。感谢电视剧制片人 Thomas 


- 1%2年由哥伦比亚广播公司出版。版权 所有。 未经允许不得使用。关于进一步的信息，请看， J . E . 

Pfeiffer,The Thinking Machine (New York ： J . B . Lippincott , 1962) Q -作者原注 
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H . Wdf 为作者提供了上述细节。他首先提出了计算机编写剧本的想法，提出这一想法的还有 

Douglas T . Ross 和 Harrison R . Morse ， 他们制作了计算机程序 

1952年夏天 ， Christopher Strachey 用 Ferranti Mark I 计算机的硬件随机数生成器写出/如下 

信件： 

Honey Dear 

My sympathetic affection beautifully attracts your affectionate enthusiasm . You are 
my loving adoration：my breathless adoration . My fellow feeling breathlessly hopes for 
your dear eagerness . My lovesick adoration cherishes your avid ardour . 

亲爱的： 

我敏感的爱美好地吸引着你的深情。你是我至爱的敬慕者：我至死不渝的敬慕者。我的 
那份感情至死不渝地盼望着你的亲爱的热情。我相思病似地敬慕珍爱着你强烈的热诚 。 

Yours wistfully M . U . C . 

[Encounter 3 (1954) ， 4 ， 25 〜 31 ; 另外一个例子出现于 Pears Cyclopedia 第64 版关于电子计算机的 
文章中 （ London ，1955)，190〜191。] 

毫无疑问读者会有许多关于怎样来教计算机进行创造性写作的想法；本题的要旨正在于此。 

► 6. [40] 考察在你的单位里的每台计算机装置的子程序库，并且用好的随机数生成程序来代 

替原来的程序。你会有惊人的发现。 

► 7.[ M 40] —位程序员决定通过使用由带有 m = 2 32 的（1〉生成的周期为2 32 的一个线性同余序 
列〈 X ,,〉，以对他的文件进行加密。他取最高有效位 LX ，,/2 16 」 并同他的数据做异或运算，但对于参 

数 a ， c 和保密。 

通过设计一个方法，它只给出对于0<7?< 150的 l _ X „/2 16 」 的值，就可在一个合理的时间内推 
出乘数 a 和头一个差由此证明这不是一个很安全的方案。 

8. [ M 15] 试提出一个检验线性同余生成程序的实现是否适当地工作的好方法。 

9 . [ HM 32 ] iS ，…是在 ran - start 已经以种子 s 初始化生成过程之后由 ran _ array 产 

生的数，并考虑多项式 

Py ,( z ) = x , ! + 62 z " + X ，, +61 2 ： 98 + ... + X „ z 37 + X ,, + 99 z 36 + …+ + X n+63 

a ) 证明，对于某个指数 A ⑴，尺,“〉 4 ⑺-，, (模 2 和 + + 

b ) 借助于5的二进表示来表达 A ( ^)。 

C ) 证明，如果，…是由种子5^5通过相同的程序产生的数的序列，我们有：对于0< 

100, X „ + , = X ； 1+ ,( modulo 2) 仅当 \ n ~ n \ >2 70 — 1 时。 

10. [22] 把 ran _ array 和 ran _血 々的 C 代码转换成精确地生成相同的数的序列的 FOR - 
TRAN 77 子程序。 

► ll .[ M 25] 假定对于双精度 （ double ) 类型的浮点算术运算在 4.2.2 小节的意义下被适当地舍 
入（因此当对这些值作适当约束时它们是精确的）。试把 C 程序 ran — aray 和 ran - start 转换成 

为提供在[0，1)范围内的双精度随机分数，而不是30个二进位整数的类似程序。 

► 12. [ M 21 ] 对于只对[- 32768,32767] 范围内的整数进行算术运算的一个小型计算机来说， 

什么随机数生成程序将是适当的。 

13. [ M 25] 试把习题 3 . 2 . 1 . 1-12 的带借位减法的生成程序同在本小节的程序中实现的延搁 
斐波那契生成程序做比较。 

► 14. [ M 35] (未来与过去） 令 X „-( X„_37 + X )( - 10 o ) mod 2,考虑序列 

( Y 0 , y 1，…〉二 ( ，^，…，又 99 ，乂200， X 2 01 ，…，乂299，乂400，乂401，…， X 499 ，，…) 
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3.6 小结 


(这个序列对应于在抛弃一半的元素之后，重复地调用 rar ? _ array ( a , 200 ) 而且只考察最低 
有效位。）使用序列〈 V ,,〉，下列实验重复进行一百万次，生成100个随 机位； 然后如果它们中有60 
个以上为零，就再生成一位并打印它。”这个结果打印14527个0和13955个1;但是28482个随机 
二进位包含至多13955个1的概率仅大约为.000358。 

试给出为什么输出中有这么多0的数学解释。 

► 15. [25] 试编写一个 C 代码，通过如同正文中所建议的那样拋弃除了每1009个元素的头100 
个之外的所有其它元素，使得可以方便地生成由 ran _ array 所得到的随机数。 
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第 4 章算 术 

Seeing there is nothing (right well beloued Students in the Mathematickes) 
that is so troublesome to Mathematical! practise y nor that doth more molest 

and hinder Calculators, then the Multiplications 9 Diuisions,square and 

cubical Extractions of great numbers f which besides the tedious 
ex pence of time, are for the most part subiect to many slippery errors . 

I began therefore to consider in my minde, by what certaine and 

ready Art I might remoue those hindrances. 

由于认识到这样一点（学数学的学生们在这点上看法很对），即， 
在数学的实践中，没有什么 t 匕大数的乘法、除法、开平方和立方更麻烦， 

更能折磨和困扰搞计算的人了， 
它们除了花费大量的时间外 , 
还成为引起许多不可琢磨的错误的大部分来源。 

我开始在脑海中琢磨， 
通过什么知识和现成的技巧，才能消除这些障碍。 

- JOHN NEPAIR [NAPIER] (1616) 

I do hate sums. There is no greater mistake than to call arithmetic an exact 

science. There are. . . hidden laws of Number which it requires a mind 
like mine to per cel ve . For instance，if you add a sum from the bo t tom up, 

and then again from the top down, the result is always different■ 

我憎恶求和。再没有比把算术称做精确的科学更大的错误了。 
…… 存在着一些关于数的潜在法则要求像我这样的人去理解。 
例如，假定你由下而上地求某个和，而后再由上而下地求它，结果总是不同的。 

- M.P.LA TOUCHE (1878) 

I cannot conceive that anybody will require multiplications at the fate 
of 40 ， 000 ， or even 4，000 per hour; such a revolutionary change as the 

octonary scale should not be imposed upon mankind in general 

for the sake of a few individuals. 

我不能想像，有人需要以每小时 40 000 次 
或者即使是 4 000 次的速度来做乘法 计算 ; 
对于像八进制换算所引起的这种革命性的变化， 
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一般不应为了少数人而强加于全人类。 

- F.H.WALES (1936) 


Most numerical analysts have no interest in arithmetic . 

大多数数值分析家都对算术不感兴趣。 

- B.PARLETT (1979) 

本章的主要目的是对四种基本算术运算——加法、减法、乘法和除法，进行仔细 
的研究。许多人以为，算术只不过是小孩子学的和计算机做的微不足道的事情。但 
我们将看到算术是一个迷人的课题，有着许多有趣的方面。对算术也就是数值计算 
的有效方法进行透彻的研究是很重要的，因为算术是许多计算机应用的基础。 

事实上，算术是在世界历史上起着重要作用的一个活生生的课题，而且它仍然 
在继续急速发展。本章我们将分析对许多类型的量进行算术操作的算法，这些量包 
括“浮点”数、极其大的数、分数（有理数）、多项式和幂级 数等； 我们还将讨论诸如进 
制转换、数的因子分解和多项式求值等这样一些有关的课题。 

4.1 定位计数系统 

我们进行算术运算的方法，与表示所处理数的方式密切相关。所以，从讨论表 
示数的主要方式来着手进行算术的研究，是适宜的。 

用基数 6( 或 者进制 M 的定位记数法由规则 

(••• a 3 a 2 aia 0 . a - l a. 2 , '')b = 

‘_• + <2 3 + <22 办 2 十 CL\b^ + + CL - \b 1 + CL -lb 2 ■十 * • • ( 1 ) 

来定义，例如 ， （SZOAfSW + SW + 0 + >6 _1 = 192 I 。当然，通常的十进计数 

法，是6等于10,且诸 a 是从“十进数”0，1，2,3,4,5,6,7,8,9中选取的特殊 情况； 在 
这种情况下， （1) 中下标6可以省略。 

当取6为一大于1的整数，而且要求诸 a 是在6的范围内的整数时，我 

们就得到了十进计数系统的最简单推广。这就为我们提供了标准的二进 （6 =2)，三 
进 （6 = 3)，四进=4)，五进幼= 5)，…数系统。 一 般说来，我们可以取6为任意非 
零数，而且可以从任何特定的一组数中选择 a ; 如同我们将看到的，这导致某些有趣 
的情况。 

(1) 中 a Q 和之间出现的点，称为进 制数点 （当^ = 10时，它亦叫做小数点， 

而当纟= 2时，它有时叫做二进小数点，等等）。欧洲大陆的人经常使用逗号来代替 
句点以表示小数点。英国人以前使用抬高的点。 

(1) 中诸 a 称为表示的数字。通常对应于大的々的数字&要比对应于小的々的 

数字以“更重要”，因此最左边的或“前导的”数字称为最 高有效位数字 ，而最右边的或 

“ 尾部”数字称 为最低有效位数字。 在标准的二进系统中，二进数字通常称做位。在 
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标准的十六进系统（进制为 16) 中，通常以 

0 ， 1 ， 2,3,4,5,6,7,8,9 ， A ， B ， C ， D ， E，F 

表示从0到15的十六个数字。 

数表 ZK 的历史发展是 一 段引人人胜的故事，其发展与文明本身的发展并驾齐 
驱。 如果我们要详细地考察这段历史，那就会扯远了，但考察一下它的主要特征却 
是有教益的。 

数表 Z 5 的最早形式，仍然可以在原始的文化中找到，它一般都是以手指头或一 k 
堆石头等等为基础的，通常伴以特殊约定，就是以一个特殊类型的对象或者一个特 
殊位置来代替更大的一大堆或一组对象，比如说五个或十个。这样的系统就自然地 
导致了以书写形式来表示数的早期形式，诸如巴比伦的、埃及的、希腊的、中国的和 
罗马的数字系统。但是，除了在最简单的情况下外，这样的记号对于实施算术运算 
来说，是十分不便的。 

20世纪以来，数学史家们对于考古学家在中东发现的早期的楔形文字表进行 
了广泛的 研究。 这些研究表明巴比伦人实际上有两种不同的数表示 系统： 日常商务 
交易中使用的数，是按十、百等等分组为基础的记号写出的，这个记号继承了更早的 
美索不达米亚文化，它很少用到大的数。然而，当考虑更困难的数学问题时，巴比伦 
数学家就广泛地利用六十进（进制为 60) 的定位计数法，至少早在公元前1750年，它 
就已高度地发展了。这个计数法是独特的，因为它实质上是省略了指数的浮点表示 

形式； 六十的适当的比例因子或乘幂由语境提供，使得例如数2,120,7200, ^等等 

都以相同的方式写成。利用辅助的表，这个记号对于乘法和除法是特别方便的，因 
为小数点的调整不影响 答案； 作为这个巴比伦记号的例子，考虑早期表的下列 摘录: 

30的平方是 15( 它也可以读成“+的平方是+ ”）；81 = (1 21) 60 的倒数是 （44 26 

40) 6 。 ； 而后者的平方是 （32 55 18 31 6 40) 60 o 巴比伦人对于0有一个符号，但由于 
他们的“浮点”原理，它仅用于数的中间，而不在右端用来表示比例因子。关于早期 

巴比伦数学的有趣历史，请看 O . Neugebauer , The Exact Sciences in Antiquity 
( Princeton , N . J . : Princeton Uriversity Press ，1952) ，以及 B . L . van der Waerden , Sci ¬ 
ence Awakening , 由 A . Dresden 译成英文 （ Groningen : P . Noordhoff ， 1954); 也见 D . E . 
Knuth , CACM 15 (1972)，671 〜 677; 19(1976) ，108。 

定点的定位计数法看来首先是由玛雅印第安人于约2000年前在中美洲建立起 
来的； 它们的二十进系统是高度发展了的，特别是在联系到天文记录和日历方面。 
他们在大约公元200年就开始用书写符号表示零。但是西班牙征服者毁掉了玛雅 
关于历史和科学的几乎所有书籍，所以关于美洲土人已经如何精通算术，我们知之 
甚少； 已经发现了一些专用的乘法表，但未见有除法的例子。[见 J.Enc S . Thomp ¬ 
son , Con trj 6 ufions to Amer. Anthropology and History 7 (Carnegie Inst . of Washington , 

1941) ， 37 〜 67 ; J ■ Justeson , “Ancient Mesoamerican computing practices ” y History of 
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Science 3 ( Rome ： Istituto della Enciclopedia Italiana ) ，待出。 ] 

在公元前若干世纪，希腊人应用早期形式的算盘来进行他们的算术运算。这种 
算盘是一块板，上面放着沙子和（或）卵石，它们的行和列以自然的方式对应于我们 
的十进制系统。也许使我们感到惊奇的是，这种定位计数法从未应用于数的书写形 
式，因为我们已经非常习惯于使用笔和纸来进行十进计 算了； 但用算盘计算的极大 
方便（因为当时手写还不是一项普遍的技巧，而且因为算盘计算可以不需要记忆加 
法和乘法表）大概使希腊人觉得，那种认为在“草稿纸”上才能更好地完成计算的主 
张是愚蠢的。同一时期，希腊天文学家确曾使用了对分数的六十进的定位计数法， 
这是他们从巴比伦人那儿学来的。 

我们的十进记号与古老的形式不同，主要是因为它有固定的小数点，它还有表 
示零的符号以标记一个空位置。零符号首先是在印度的印度教文化中建立起来的。 
这一记号最初出现的确切日期不能十分确定，一个比较可靠的猜测是大约在公元 
600年。在这个时期印度的科学相当发达，特别是在天文学方面。现在已知的使用 
十进记号的最早的印度手稿上，数字是逆着写的（即最高位数字在右边），但不久最 
高位数字在左边就成了标准。 

大约在公元750年，随着许多重要的著作翻译成阿拉伯文，印度的十进算术的 
原理传到了波斯，在一份 Abraham Ibn Ezra 所写的希伯莱文件中，生动地叙述了这 
一发展，这一文件已译成英文，见 AMM 25 (1918),99 〜108。这以后不久， al _ 
Khwarizml 写出了关于这个课题的阿拉伯文的课本（如同第1章所说明的，我们的 
“ algorithm ” （算法）一词来自于 al - Khwanzml 的名字）。他的书被译成拉丁文，而且 
对 Leonardo Pisano (斐波那契）有巨大的影响。斐波那契关于算术的著作（公元1202 
年），在把印度-阿拉伯数字传播到欧洲这一点上起了重大作用。有趣的是，自左到 
右地写数的顺序，在从印度到阿拉伯和从阿拉伯到拉丁这两次传播期间，都没有改 
变，尽管阿拉伯文是从右往左写的，而印度文和拉丁文是从左往右写的 。 David Eu ¬ 
gene Smith 在他的 History of Mathematics 1 ( Boston : Ginn and Co . ， 1923) 第 6 章和第 

8 章中，记述了随后在12⑻年到1600年期间十进记数法和算术传遍于欧洲的详细 
历史。 

十进制记法最初仅仅用于整数，而不是小数。阿拉伯天文学家在他们的行星图 

和其它表中需要使用小数，他们继续使用以六十进小数为基础的 Ptdemy (著名的希 

腊天文学家）的记号。六十进系统，作为原始的巴比伦六十进记法的一个残迹，今天 

还幸存下来在“度分秒”的三角单位中及时间单位中使用。早期的欧洲数学家在处 

理非负整数时，也使用六十进 小数； 例如，斐波那契给出值 

1° 22' 7" 42" 33^ 4 V 40 w 

作为方程工 3 十2工 2 十 10 ：r = 20的根的近似值（正确的答案是 1°22 / 7"42 W 33 A 4 V 38^30" 

50*15 fl 43 J .") o 

对于十分之一、百分之一等等，以类似的方式使用十进记号，似乎只是一个相当 
小的 变化; 但是，破坏传统当然是困难的，而且六十进小数比起十进小数来，有其优 
点，即诸如1/3这样的数，可以用一种简单的方式精确地表达出来。 
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中国数学家（他们从未使用六十进制）是首先使用十进小数的等价记号的创始 
人，尽管他们的计数系统（没有 0) 严格说来原先并不是定位计数系统。中国的重量 
和度量单位是十进的，所以祖冲之（卒于公元501年）能把 7 T 近似地表达为 

3丈，1尺，4寸 ，1 分，5厘，9毫，2秒（丝），7忽 

这里丈，…，忽都是长度的 单位； 1忽（一根丝线的直径）等于1/10丝等等。大约 
在公元1250年后，中国就相当广泛地使用了这样一种类似于十进的小数。 

真正的十进小数定位计数系统的萌芽形式见于一位名为 al - UqlidisT (“欧几里得 
的门徒”）的无名数学家在大马士革写的一部10世纪的算术教科书中。他有时对小 
数点的位置作了标记，比如说在同复利有关的问题中，对于计算135乘 

(1.1 )”。[见 A.S.Saidan, The Arithmetic of al - Uqlldisl ( Dordrecht ： D. Reidel, 

1975) ， 110 ， 114,343,355,481 〜 485 。 ] 但他没有充分地发展这一思想，而且他的技巧 

不久就被忘却了。巴格达和巴库的 A 卜 Samaw’al 在 1172 年写到，他懂得 vTO = 


3. 162277…但他没有方便的方法把这个近似值写下来。过了好几个世纪之后一位波 
斯数学家 al - KkhT 才重新发明了十进小数， ai - Kkhl 死于1429年。 al - KSshl 是一位 
有高度技巧的计算家，他给出了 2 k 精确到16位的值 如下： 


整数 

小数 

0 

I 

6 

2 

8 

3 

1 

1 

8 

5 

3 

0 

7 

1 

7 

9 

5 

8 

6 

5 


这是直到 1596 一 1610 年间， Ludolph van Ceulen 费尽气力计算到 35 位之前，所知的 


7 T 的最好的近似值^ 

十进小数开始零星地出现于欧洲，例如，一种所谓的“土耳其方法”曾被用于计 
算 153. 5 x 16.25 = 2494.375; 1450 年前， Giovanni Bianchini 将它用于测量，进一‘步 

发展了这一方法，但和 al-UqlTdisI —样，他的工作似乎影响不大。 Christof Rudolff 和 
Francois Viete ^ 1525 和 1579 年再次提出这一思想。最后，比利时人 Simon Stevin 

于 1585 年独立地提出了关于十进小数的思想，他写的算术教科书流传很广。他的 
工作和不久以后对数的发现，使得十进小数于 17 世纪在欧洲已非常普及。[关于进 
— 步的评述和参考文献，见 D. E. Smith, History of Mathematics 2 (1925),228 〜 
247; V. J . Katz, A History of Mathematics ( 1993) ， 225 〜 228 ; 及 G. Rosinska,Quart. 
J.Hist.Sci. Tech. 40 (1995) ， 17 〜 32。] 

二进制计数系统有它自己有趣的历史，据了解，今天还存在的许多原始部落，都 
使用二进的或“对偶”计数系统（即以两个为一组而不是以五个或十个为一组）计数， 
但他们并不是以真正的二进系统来计数，因为他们并不以一种特殊的方式来处理2 
的幕。关于原始计数系统的有趣细节，请见 Abraham Seidenberg , The Diffusion of 
Counting Practices, Univ. of Calif. Publ. in Math . 3 (1960) ，215 〜 300 。 另一个实质上 

是二进系统的“原始”例子，是通常表达节奏和时间持续的音乐记号。 

欧洲在17世纪讨论了非十进的数字系统。在很长时间内，天文学家有时用六 
十进数来表示整数和小数，这主要是当进行乘法运算时[见 John Wallis, Treatise of 
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Algebra ( Oxford : 1685 ) ， 18〜22，30 ] 。关于任何大于1的整数都可作为进制这 一 事 
实首先是在 Blaise Pascal ( 帕斯卡）的著作 De Numeris Multiplicibus 中明确提岀的，它 
大约写于 1658年[见 Pascal,CEuvres Completes ( Paris-.Editions du Seuil , 1963),84 

89]。 帕斯卡 写到： “十进系统已经建立起来，当然有点愚蠢，这是按照人的习惯，而 
不是像大多数人所想像的根据自然的需要确定的。”他指出，改用十二进系统将是受 
欢迎的，而且他给出了检验一个十二进的数被9除的可除性的规则 。 Erhard Weigel 
于1673年开始在一些出版物中大力鼓吹四进系统 。 Joshua Jordaine 对十二进算术 


进行了详细的讨论，见 Duodecimal Arithmetick ( London ，1687) 。 

在那个时代，尽管算术已经几乎全部使用十进记号，但其它的重量和度量系统 
却很少以10的倍数为基础，而且许多商业事务在进行诸如镑、先令及便士这些量的 
加法中需要大量的技能。因此，若干世纪以来，商人们学会了计算以货币、重量和尺 
寸的特殊单位表示的数量的和与差；因而他们采用的算术运算都是非十进计数系统 
的。从13世纪或更早些，在英国通用的液体量度，是特别值得注意的： 

2及耳=1焦品 2半蒲式耳=1蒲式耳或弗肯 
2焦品=1品脱 2弗肯=1克德肯 


2品脱=1夸脱 2克德肯 二1 巴力尔 

2夸脱=1勃特 2巴力尔=1霍士赫德 


2勃特=1加仑 2霍士赫德=1贝北 

2加仑=1配克 2贝北=1担 


2配克=半蒲式耳 

表示成加仑、勃特、夸脱、品脱等等的液体的数量实质上是以二进记号写成的。也许 



已知的头一个纯粹的二进记号，大约岀现于1605年的 Thomas Harriot (1560— 
1621) 的某些未发表的手稿中。 Harriot 是一个有创造性的人，他由于作为 Walter 
Raleigh 爵士的代表来到美国而闻名。他发明了（随其它发明一起）类似于现在用做 
“小于”和“大于”关系的 记号； 但由于某种原因他决定不把他的许多发明发表出来。 
关于他的二进算术笔记的摘录已由 John W . Shirley 加以发表 [Am er . J . Physics 19 
(1951) ,452— 454 ] ; Harriot 关于二进记号的发现是由 Frank Morley 首先提及的 
[The Scientific Monthly 14 (1922)，60〜66 ] o 

关于二进系统的头一个公开的讨论见于一位杰出的西斯特主教 Juande Cara - 
muel Lobkowitz 的著作 Mathesis Biceps 1 ( Campanise : 1670) ， 45 〜 48 。 Caramuel 相当 

详细地讨论了在2,3,4,5,6,7,8,9，10，12和60进制下的数的表示，但除了在60进 
制的情况下之外，没有给出非十进系统中的算术运算的例子。 

最后，由 G . W. Leibniz (莱布尼茨）所写的一篇论文 [MSmoires de V Academie 
Royale des Sciences ( Paris ， 1703 )，110 〜 116 ]， 阐明了二进加法、减法、乘法和除法，真 

正地把二进制计数法引人殿堂，因而这篇论文通常被看成是二进制算术的起源。莱 
布尼茨后来十分经常地引用二进系统。他并不推荐用二进制来做实际计算，但他强 
调了二进制在数论研究中的重要性，因为数列在二进制计数法下的样式通常比它们 
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在十进制记法下更为 明显； 他也看到了每一事物都可借助于0和1来表达这一事实 
的神秘意义。莱布尼茨未发表的手稿表明，早在1679年，他就已经对二进计数系统 
感兴趣，那时他把它叫做“ bimal ” （双的）系统(类似于“ decimal ” （十的）系 统）。 

Hans J . Zacher 对莱布尼茨早期关于二进系统的工作进行了仔细的研究 [Die 


Hauptschriften zur Dyadik 


von G . W. Leibniz ( Frankfurt am Main : Klostermann , 


1973)]。 Zacher 指出，莱布尼茨熟悉 John Napier 的所谓“局部算术”，即用石头来进 
行计算的一种方法，这等于是用一种二进制的算盘。 [ Napier 把他的局部算术的思 
想作为他的小书的一个附录发表于1617年；它可以称做世界上的头一 k 
个“二进计算机”，而且它当然是世界上最便宜的，尽管 Napier 感到它的实用性还不 

如它的趣味性。见 Martin Gardner 在 Knotted Do ugh nuts and Other Mathematical 
Entertainments (New York : Freeman ， 1986 ) 第 8 章中的讨论。] 

有趣的是对于小数点右边的负幂次这一重要概念，那时还未被很好认识。莱布 
尼茨曾要求 James Bernoulli (伯努利）在二进系统中计算 k ，而伯努利是这样来“解 
决”这个问题的，即，通过对 tt 取 35 位十进位的近似值，并把它乘以 10 35 , 然后以二 
进系统来表达这个整数，这就是他的答案。如果只考虑前几位，这等于说 ^3.14, 


而且（314) 10 = (100111010) 2; 因此在二进制下 tt 是 100111010![见 Leibniz , Mar / i . 


Schriften , K . Gehrhardt 编辑， 3 (Halle :1855)， 97; 由于计算错误， 118 位答案中有 2 
位是不正确的。]伯努利的计算的动机显然是要看看在 tt 的这种表示中能否观察到 
什么简单的模式。 

瑞典的查尔斯十二世的数学才能也许超过了世界上所有其他国王。在大约 
1717年，他提出了八进制算术的思想。这大概是他自己的发明，尽管他于1707年 
曾经同莱布尼茨短暂地见过面。查尔斯觉得8或64进制比起十进制来更便于计 
算，因此他考虑在瑞典引进八进 算术； 但他在进行这样一项变革之前死于战争中[见 

The Works of Voltaire 21 ( Paris ： E . R . DuMont , 1901) , 49 ; E . Swedenborg , Gent / e - 
man f s Magazine 24 (1754) ,423 〜 424] 。 

1750 年前，威廉和玛丽学院 （College of William and Mary ) 的教授 Hugh Jones 牧 
师也在殖民地的美国提出了八进计数法[见 15 (1745),377- 
379； H . R . Phalen y AMM 56 (1949) ， 461 〜 465] 。 

大约 一 个多世纪以后， 一 位名叫 John W . Nystrom 的杰出的瑞典裔美国土木工 
程师决定把查尔斯十二世的计划推进一步，而且他以十六进算术为基础设计了计 
数、重量和度量的一个完备系统。他写道•.“我不害怕或者说不踌躇来鼓吹二进制的 
算术和度量衡系统。我知道大自然在我这边。若我不能成功地使你们对其方便性 
和于人类的巨大重要性留下深刻印象，那么就说明我太不信任我们这一代，我们的 
科学人员和我们的哲学家了。” Nystmm 想出了对于十六进数读音的特殊 方法； 例如 

( C 0160) 16 被读做 “ vybong ， bysanton ，> 0 他的整个系统称为托纳尔 （ T 6 nal ) 系统，并在 

J . Franklin Inst . 46 ( 1863)，263〜275，337〜348，402〜407中对它作了 描述。一个 
类似的系统，但使用八进制，大约在同时为 Alfred B . Taylor 提出 [ Proc . Amer . Phar - 
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maceutlcal Assoc. 8 (1859) , 115 ~ 216 ; Proc . Amer. Philosophical Soc. 24 (1887) ,296 

〜 366]。 在那个时代，法国度量衡公制系统的推广使用，引起了关于使用十进算术 
优点的许多辩论。事实上，当时在法国就已有人建议使用八进制 [ J . D . Collerme ， L e 

Systeme Octaval ( Paris ： 1845) ; Aime Manage , Numeration par Huit ( Paris ： Le Non - 

nant , 1857) ] 0 ' 

远自莱布尼茨时代以来，二进系统就已经作为新奇的事物而闻名，而且 R C . 
Archibald 汇集了大约20篇关于它的早期文献 [AMM 25 (1918) ，139〜 142] 。它主 

要应用于乘幂的计算，如同在 4.6.3 小节所说明的那样，也应用于分析某些游戏和 

难题 。 Giuseppe Peano [Atti della R. Accademia delle Scienze di Torino 34 (1898),47 
〜 55] 使用二进位记号作为 256 个符号的“逻辑”字符集的基础 。 Joseph Bowden 
[Special Topics in Theoretical Arithmetic (Garden City : 1936) ， 49] 给出了十八进制数 

的术语系统。 

Anton Glaser 的著作 of * Binary and Other Nondecimal Numeration (Los 

Ang e l eS : T 0 m as h ，1981)， 包含有关二进计数法发展的丰富和近乎完整的讨论，包括 
以上引证的许多著作的英文翻译[见 HistoWa Math. 10 (1983),236 〜243]。 

计数系统的许多近来的历史都同计算机器的发展相联系 。 Charles Babbage 在 
1838年的笔记表明，他考虑过把非十进数用于他的分析机 （Analytical Engine ) 中 
[ M . V . Wilkes,Hisroria Math. 4 (1977),421]。 由于对实现算术运算，特别是实现乘 
法的机械设备的兴趣日益增加，导致了 20世纪30年代很多人考虑把二进系统用于 

实现这一目的。 E . William Phillips 在题为 “Binary Calculation ” 的文章 [Journal of Ae 

Institute of Actuaries 67 (1936) ， 187 〜 221] 中，以及在他关于这一问题的讲座之后的 

讨论记录中，对这样的活动做了可喜的记述。 Phillips 的开场白 是：“ （本文的）最终 

目的是说服整个文明世界拋弃十进数而用八进数来代替它。” 

Phillips 的论文的现代读者也许会惊奇地发现，在那时的所有英语字典上，就如 
同十进数系统被正确地称做 “ denary ” 或 “ decimal ” （“十进位的”）那样，八进数系统已 
被正确地称做 “ octonary ” 或 “ octonal ” (“八进位的”）;直到1961年以刖，在英语字典 
中一直未出现有 “ octal ” （八进制）一词，而且它显然是作为某类真空管的“基极”的一 
个术语而开始的。 “ hexadecimal ” （十六进制的）一词出现于我们语目中的时间更晚， 
它是希腊语和拉丁语词干的混合；更恰当的术语是 “ senidenary ” 或 “ sedecimal ” 或甚至 
“ sexadecimal ” （十六进位的）。但后者对于计算机程序员来说或许有伤风化 （ sex 含 

有性的含义——译者注）。 

本章开始处所摘录的 Wales 先生的评述，就是从同 Phillips 的论文一起印刷的 
讨论记录中摘出的。参加同一讲演的另一个人指出了八进制系统对于商业有一个 

缺点： “5%变成了 64分之 3. 1463,它听上去未免太可怕了。” 

Phillips 从能够进行二进制计数的一个电子线路中得到了对于他的建议的鼓舞 

_ C . E . Wynn ~ Williams , Proc . Roy. Soc. London A136 (1932) ， 312 〜 324] 。自 20 世纪 

30年代以来，用于一般算术运算的电子机械和电子线路开始发展，主要贡献是由美 
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国的 John V . Atanasoff 和 George R . Stibkz ， 法国的 L . Couffignal 和 R . Valtat 以及德 
国的 Helmut Schreyer 和 Konrad Zuse 做出的。这些发明家都用到了二进系统，尽管 

StibUz 后来发明了余3二-十进制计数法。所有这些早期发展的动人记述，包括当时 

重要资料的再版和译介，见 Brian Randell , The Origins of Digital Computer ( Berlin ： 
Springer ， 1973) 0 

20 世纪 40 年代初建造的美国第一台高速计算机，用的是十进算术。但在1946 

年, A . W . Burks , H . H . Goldstine 及 J . von Neumann 在同第一台存储程序计算机的设 

计有关的一份重要的备忘录中，对于决定背离传统进制而使用基数为2的计数制做 

了详细的论证[见 John von Neumann，CoWectecf Works 5,41 65 ] 0 自那以后，二进 

计算机已经成倍发展，在有了使用二进机器十多年的经验之后。 W . Buchholz 在他 
的文章 “Fingers or Fist ?” [CACM 2，12 ( 1959年 12 月），3 〜 11 ] 中，讨论了二进制的 

相对优点和缺点。 

本书中所使用的 MIX 计算机，已经定义成既可以是二进的，也可以是十进的。 
说明这样一点是有趣的，即几乎所有的 MIX 程序全都可以在无须知道正在使用的是 
二进的还是十进的符号的情况下表达出来——甚至当我们进行多精度算术运算时 
也如此。因而，我们发现，进制的选择对于计算机程序设计并没有重大的影响。（然 
而，对于这一陈述，有一个值得注意的例外，那就是 7. 1节中所讨论的“布尔”数算 
法； 也见算法 4.5.2 B 。) 

在一台计算机中，负数的表示有若干不同的方法，而且这有时会影响完成算术 
运算的方式。为了了解这些记号，让我们首先把 MIX 看成一台十进制的计算机，于 
是每个字包含10个数字和一个正负号，例如 

-12345 67890 (2) 

这叫做 带符号的量表 示法。这样一种表示同普通的符号约定是一致的，所以许多程 
序员都喜欢它。一个潜在的缺点是有负零和正零两种表示，而通常它们应表示同一 
个数； 这种可能性要求在实践中稍留点心，尽管它只是有时有用。 

进行十进算术的大多数机械计算器，都使用另一个叫做10 的补码 记法的系统。 
如果我们从00000 00000减去1，在这种记法下我们得到99999 99999;换言之，对于 
这个数不附加明显的正负号，而且计算是模10 1() 进行的。数 - 12345 67890在10的 

补码记法下将呈现为 


87654 32110 (3) 

在这种记法下，通常把前导数字为5,6,7,8或9的任何数看成是一个负的值，尽管 
相对于加法和减法，把 （3) 看成是数+ 87654 32110并无妨碍，如果这样做是方便的 

话。对于10的补码记法没有“负零”的问题。 

在实践中，带符号的量表示法和10的补码记法之间的主要差别，是右移并不使 
补码记法的量除以10;例如，数 -11= —99989,右移一位，得出 ‘"99998= -2( 假定 
当所移的数为负时，右移一位就插入“9”作为前导数字）。 一 般来说，在10的补码记 
法下，无论： r 为正还是为负，: r 每右移一位都给出 U /10」。 
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10 的补码系统的一个可能的缺点 是：它 关于零不对称 4 位数字负数 500 … 0 不 
是任何 p 位数字的正数的负值。因此把 x 变成可能引起溢出。（关于 有无限 
精度的进制补码记号的讨论，见习题7和31。） 

高速计算机刚问世后，就已经使用了另一种称为9 的补码 表示的记法。在这种 
情况下，数-12345 67890将呈现为 

87654 32109 (4) 

负数 - 的每位数字等于9减去的对应数字 0 不难看出，一个负数的9的补码记 
号总比对应的10的补码的记号小1。加法和减法是以模 10 m - l 进行的，它意味着 
离开左端的一个进位被加到右端上（参考 3.2.1.1 小节模 w -1 算术的讨论）。这 
样，对于负零又产生了潜在的问题，因为99999 99999和00000 00000都表示同一个 

值。 

刚才对10进制算术所说明的思想可以类似的方式应用于2进制算术上，对于 
它们，我们有 带符号的量， 2 的补码和 1 的补码 记法。对于 n 个二进位数的2的补 
码算术是模2” 的 算术； 1的补码算术是模2” - 1的算术。如同在本章中的例子中 
所使用的那样， MIX 计算机仅仅处理带符号的量的算术 运算； 然而，当有必要时，在 
有关的正文里也会讨论关于补码记法的另外的一些过程。 

喜欢细节的读者和版面编辑应当注意在像“2的补码”和“1的补码”这样的术语 
中撇号的位置（指英文表示——译者 ）：2 的补码关于2的一个次幂求补，而1的补码 
是关于1的一个长的序列求补。其实，也还有3进制的2的补码和关于 (2 …22) 3 的 

补码。 

机器语言的描述经常告诉我们，计算机的线路在每个数值的字中的一个特定位 
置处设置进制点。对这种陈述通常可不予理睬。如果我们预先假定小数点处于某 
个位置，则最好知道关于在一个指令的结果中小数点将在何处出现的规则。例如, 
在 MIX 的情况下，我们可以认为我们的操作数是小数点在极右的整数，或者是小数 
点在极左边的分数，或者作为这两个极端的某种混合。关于在加法、减法、乘法或除 
法之后小数点的出现的规则则是直截了当的。 

容易看出，在进制6与进制 M 之间有一个简单的 关系： 

(… a — 1( 3— 2 …） 6 = (••• A 3 A 2 A 1 A 0 . A— 2 …V ⑸ 

其中 

Aj — ( ^kj + k — I a kj + \ Q kj 3 b 

见习题8。于是我们一眼就能看出，比如说，在2进制与16进制之间简单的转换技 
术。 

除了至今讨论的标准6进制系统之外，定位计数法还有许多有趣的变形。例 
如，我们可以有进制为（- 10) 的数，使得 

(•■•a 3 ^2 <2 i <2 o- = **' + a 3 ( - 10) 3 + <2 2 ( — 10 ) 2 + a l (— 10) 1 + a 0 + … = 


警馨參 


1000^3 + 100^2 — 10 a 1 + ao ~ 




10 


^-1 + 




100 


a 
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这里，恰如在十进系统中那样，各个数字都满足0<以<9,在“负十进”系统中数 
1234567890将呈现为 


(1 93755 73910) _ 10 (6) 

因为后者表示10305070900 -9070503010。有趣的是，注意这个数的相反数，即 
- 1234567890,将被写成 


(28466 48290) — 1。 (7) 

而且，事实上，在负十进系统中，每个实数，无论是正还是负，都可以表示出来，而不 
用带符号。 

负进制系统首先是由 Vittorio Grunwald 考虑的 [Giornale di Matematiche di 

Battaglim 23 (1885)，203 〜 221 ， 367] ， 他说明在这样的系统中如何执行四种算术运 
算。 Griinwald 还讨论了求根、可除性检验及进制转换。然而，由于他的文章发表在 
不太出名的杂志上，似乎对别人的研究工作没有影响，而且很快就被忘却了。关于 
负进系统的下一个著作看来是 A . J . Kempner 的 [ AMM 43 (1936) ，610〜 617] 。他 
讨论了非整数进制的性质并且在脚注中解释说负进制也是可行的。又过了 20年， 

这 一-思想重新被发现 ，这次是由 Z . Pawiak 和 A . Wakulicz [ Bulletin de 1 f Academie 
Polonaise des Sciences y Classe III ， 5 (1957) ， 233 〜 236 ;SSrie des sciences techniques 1 
(1959)，713 〜 721] 以及 L . Wadel[IRE Transactions E 06 (1957)，123] 发现的。 20 
世纪 50 年代后期，在波兰研制了叫做 SKRZAT 1和 BINEG 的实验性计算机，它们 
使用 - 2 作为算术运算的 进制； 见 N . M . Blachman , CACM 4 ( 1961 ), 257 ； R . W . 
Marczynski , Ann . Hist . Computing 2 (1980)，37 〜 48。进一步的文献见 Trans - 
actions EC -12 (1963) ,274^276 '.Computer Design 6 (1967 年 5 月 )，52 〜 63。有证据 

表明好些人都独立地萌生过负进制的思想。例如，在1955年的一次高年级高中生 
的“寻找科学天才”竞赛中， D . E . Knuth 提交的一篇短篇论文就曾讨论过负进制系 
统，并且进一步推广到复数进制。 

2 i 进制产生出称做“虚4”计数系统的一个系统（与4进制相对照），它有异常的 

特 性:每 一个复数都可以不带符号地用数字 0 ，1，2,3来表示。[见 D . E . Knuth , 
CACM 3 (1%0)，245 〜 247。]例如， 

(11210.31) 2| =1 • 16 + 1 . (- 8 i ) + 2 • (- 4) + 1 • (2 i ) + 


a 2 „ *** a j a 0 ■ a - y ''' a - lk 

(a 2 ， "a 2 a 0 . a— 2 ".a_ 2 々） 一 4 + 2i( a 2 „ — 】… ‘ a —i … a 一 2 々 + 1 ) — 4 

所以，将一个数转换到虚 4 进记法去和从虚 4 进记法转换回来，就归结为转换成实 
部与虚部的负4进表示，和从实部和虚部的负4进表示转换回来的问题。这个系统 
的有趣性质是它允许在一种十分统一的方式下完成复数的乘法和除法，而无须单独 
地处理实部和虚部。例如，在此系统下可以像我们在任何进制之下所做的那样把两 
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个数相乘，只是使用不同的“进位”规则：每当一个数字超过 3 时，我们就将其减 4 ,并 
且在它的左边第二列“进位” _ 1 ;当一个数字为负时，我们就对它加 4 并对它左边第 
二列“进位” + 1。下列例子说明了如何运用这个特殊的进位规则 

12231 [9-10i] 

12231 [9- 10i] 

12231 

10320213 

13022 

13022 


12231 

1 - 

021333121 [-19-1801] 


一个类似的仅仅使用数字0和1的系统可以以为进制，但它要求对简单的数“广 
本身的 一 个无穷的非重复的展开 。 Vittorio Griinwald 提出在奇数位置中使用数字0 

和1/75,以避开这个问题，但这实际上糟蹋了整个系统[见 delVAteneo di 

Brescia (1886) ， 43 〜 54] 。 

如 W . Penney [/ACM 12 (1965) ,247〜 248] 所建议的，通过使用进制 i _ 1，也可 
以得到另一个“二进”复数系统： 

(… 0*4 3 a〗a 1 flo . a — 1 …）卜 1 = 


# ■ 


— 4^4 + (2 + 2 i ) ^3 — 2 ia 



i — 1 )ai + 




- ^~(i + 1) a 


1 



在这个系统中，仅仅需要数字 0 和1。证明每个复数都有这样一个表示的一种$式， 
是考虑图1中所示的有趣的集合 s ; 由定义，这个集合由所有可以写成 


s £jk^\ a k 


( i-ir ☆的点组成，其中心，〜4 3 ，〜是0和1的无限序列，它也叫做“双 


龙不规则碎片 ” （twindragon fractal ) [见 M . F . Barnsley y Fractals Everywhere , 第 2 版 


(Academic Press , 1993),306,310] o 图 1 说明了 S 可以分解成同余于士 S 的 256 个 


小块。注意，如果 S 的图形以顺时针方向转动135°，则我们就得到两个同余于 （1/ 

V 2) S 的相邻集合，因为 G - i)s = SU (S + 1)。关于 S 包含所有绝对值充分小的 

复数的详细证明，见习题18。 ^ 

也许所有数系当中最漂亮的是 平衡三进制。 它由用“三元”（三进制数字 ）- 1， 

0, + 1代替 0，1 和2的三进制表示组成。如果使用 i 来代表-1，则我们就有下列的 
平衡三进制数的例子： 

平衡的三进制 十进制 


101 

1110. 11 
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1110.11 


-32 


5 


9 


1110 


-33 


0 . 11111 … 


数 


求一个数在平衡的 
例如， 


2 


进制系统中的表示的一个方法是首先把它表示成三进制 


208.3 


(21201.022002200220 


墨暴參 




图1称为“双龙”的不规则碎片集合 S 

(用纸和笔转换成三进制数的一个非常简单的方法在习题 4.4-12 中给出。）现在加 
上三进制表示中的无穷的数… 11111. 11111…。在上边的例子中，我们得到无穷的 

数 
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(■•• 11111210012. 210121012101 …） 3 
最后，用从每个数字减 1 的办法来减去数… mu . mil …，我们得到 

208.3= ( lOlIOl.lO ioioioioio … ）3 (8) 

显然，如果我们用具有适当多个1的数来代替人为的无穷数… 11111. 11111…，就可 
以使这个过程严格化。 

平衡三进制数系有许多有趣的 性质： 

a ) 通过交换1和 i ， 就得到一个数的负值。 

b ) —个数的正负号由它的最高位的非零的“三元”量给岀，一般说来我们可以像 
在十进制系统中那样，通过从左到右地读任何两个数来使用字典序比较它们。 

C) 舍入成最接近的整数的运算，和截断是一 样的； 换言之，只须删去小数点右边 
的数。 

利用下面的表，平衡三进制系统的加法是十分简 单的： 

IIITITITToooooooooi i i l l l l l l 

T I I o o o l l i I T T o o o l i l T I I o o o l l l 

ToiIoiToiIoiIoiIoiToiToiToi 

ToTi III I o I o Hi l o I o l o l ll I o l o l ll l li 10 

(加法的三个输入，是要相加的数的数字和进位数字。）减法就是取负之后再进行加 

法； 而乘法也归结为取负和 加法； 如下例 所示： 

llOl [17] 

no! [17] 

Tioi 

Iioi 

no ! 

OllIIOl [289] 

数在平衡的三进制系统中的表示隐含于一个有名的通常叫做 “ Bachet 重量问 
题”的数学难题中，尽管在 Bachet 写他的书之前4个世纪，斐波那契就已经指出了 
它，而在斐波那契之前100多年，波斯的 Tabari 也已提到 。 [见 W . Ahrens , Mar / ie - 

matische Unterhaltungen and Spiele 1 ( Leipzig : Teubner ， 1910) ， 3.4 节 ; H . Hermelink , 

Janus 65 (1978) ,105 〜 117。] 带有负数的定位计数系统是 J • Colson 发明的 [ PMos . 
Trans 34 (1726) ，161〜173 ] ，而后它被忘却，在大约100年之后重新由 John Leslie 

爵士 [TTie Philosophy of Arithmetic ( Edinburgh ： 1817) ， 33 〜 34 ， 54 ， 64 〜 65 ， 117 ， 150] 
及 A . Cauchy (柯西) [ Comptes Rendus Acad. Sci. 11 ( Paris , 1840) ， 789 〜 798] 发现。 

柯西指出，负数字使得人们没有必要去记忆超过 5 X 5 的乘法表。有人断言，这样带 
有负数字的定位计数系统在印度很久以前就为人所知了 [见 J , Bharad ， V e d! C Mathe ¬ 
matics ( Delhi : Motilal Banarsidass ，1965) ]，但已被 K ■ S . Shukla 所否定 [ Mat/iematicai 

Education 5 ， 3( 1989 )，129 〜 133 ] 。头一个“纯粹”的平衡三进制的真正出现是在 
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Leon Lalanne 的 一 篇论文中 [Comptes Rendus Acad. Sci .11 ( Paris , 1840 )，903 〜 
905] ，他是算术运算的机械设备的设计者。在 Lalanne 的文章发表之后100年内，这 
个系统很少被提及，一直到 1945—1946 年间穆尔电子工程学校 （Moore School of 
Electrical Engineering) 的第一台电子计算机问世时为止；那时，它连同二进系统作为 

十进系统可能的替代者引起了认真的注意。进行平衡的三进制算术运算的算术线 
路的复杂性并不比进行二进系统算术运算的算术线路大很多，而且表示一个给定的 
数所需的数字个数仅仅相当于用二进表示所需数字个数的 In 2/ in 3〜63%。关于 
平衡的二进制系统的讨论见于 AMM 57 ( 1950)，90 〜 93，以及 High-speed Comput¬ 
ing" DeWces ， Engineering Research Associates(McGraw-Hill，1950)，287 〜 289 中。试 

验性的俄国的计算机 SETUN 是以平衡的三进制系统为基础的[见 CACM 3 
(1960)，149〜150]。而且，或许这个计数系统的对称性和简单的算术运算有朝一日 
将证明是十分重要的——当“触发器”为一个“三态器”所代替时。 

还有另一种重要的方式可把简单的定位计数法推广成一个混合进制系统。给 
定一个数的序列〈乂〉（其中 n 可以为负），我们定义 

…十 ^0 + 々心 1 心 0 + a \ bo + 以 0 + a-\\b + a — 2 Ib —2 + … (9) 

在最简单的混合进制系统中，我们仅以整数进行 工作； 我们设 心 ，幻，6 2 ,…为大于1 
的整数，而且仅仅处理没有小数点的数，其中要求〜处于 队 a n <b n 的范围之内。 

最重要的混合进制系统之一是阶 乘数系 ，其中 b n = n+2 0 利用这一系统，我们 
可以以形式 

c n n ! + (^ 一 〆 ?？ - 1) ! + …+ c 2 2! + cj (10) 

来惟一地表示每一个非负整数，其中对于1< A < n ， 々，而 见算法 
3.3.2P )。 

当我们涉及度量单位时，混合进制系统在日常生活中是常见的。例如，量 “3 个 
星期， 2 天， 9 小时， 22 分， 57 秒和 492 毫秒”等于 

•3 ， 2 ， 9 ， 22, 57 ； 4921 

- 7 ， 24 ， 60 ， 60 ； 1000 

量“10磅，6先令和3又+便士”，在英国变成纯粹十进制的货币系统之前，就成为英 
国货币的 I 10 ’ 2:: 3 ;] 便士。 

直接推广通常的加法和减法，就可能进行混合进制数的加法和减法，当然须假 
定两个操作数都使用相同的混合进制系统（见习题 4.3. 1-9)。类似地，简单地推广 
熟知的手算方法，即可容易地用小的整常数去乘和除混合进制的数。 

第一 '个详 尽地讨论混合进制系统的是 Georg Cantor [Zeifschri/t fur Math, und 

Physik 14 (1869),121 〜 128 ]。 习题 26 和 29 给出了关于混合进制系统进一步的信 
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涉及无理进制的某些问题已由 W . Parry 做了研究 [Acta Math . Acad . Sci . Hung . 

11 (1960),401 〜 416]。 

除了这一节所述的这些系统之外，在本套书的其它地方，还要提到表示数的其 
它途径。这些途径有组合数系统（习题 1.2. 6-56)，斐波那契数系统（习题1.2.8-34, 
5.4. 2-10)，中数系统（习题 1.2. 8-35)，模表示 （4.3. 2小节）， Gray 码 （7.2. 1小节）以 

及罗马记数 （9.1 节）等。 


习题 

I . [ J 5] 在 -2 进制的数系中表达数-10, -9,…，9，10。 

► 2. [24] 考虑下列四个数系 ：（ a ) 二进制（带符号的 M );( b ) 负二进制 （- 2 进 制）； （ c ) 平衡三进 

制； （ d ) 进制6 = 4。用上述的每一种数系表达下列三 个数： G )_ 49; ( ii ) -3 +( 表示成重复的循 

环）； （ mK (表示到一些有效位）。 

3. [20] 在虚四数系中表达 -49 + i 。 

4. [15] 假设我们有一个 MIX 程序，其中单元 A 包含一个其小数点在第三字节和第四字节之 
间的数，而单元 B 包含一个其小数点在第二字节和第三字节之间的数（最左边字节编号为1)。试 
问在执行了指令 

(a) LDA A ； MUL B (b) LDA A ； SRAX 5 ； DIV B 

之后，在寄存器 A 和 X 中，小数点该在什么地方？ 

5. [00] 如果把表示看成是正的，说明为什么一个负整数在9的补码记法下的表示总比它在 
10的补码记法下的表示小1? 

6 . [ 16 ] 在 U ) 带符号的量的二进法（包括一位符号）， （ b ) 2的补码法， （ c ) 1的补码法中，所 
能表示的最大和最小的 p 位整数各是什么？ 

正文仅对在一个计算机字中表示的整数定义了 10的补码记法，有没有办法对所有 
有“无限的精度”的实数定义10的补码记法，并且与正文定义相似？有没有一个类似的方法，对于 
所有实数，来定义9的补码？ 

8.[刪 ] 证明等式（5)。 

► 9. [15] 利用十六进数字 0,1 ， … ， 9 ， A ， B ， C ， D ， E,F 把下列的八进数改变成十六进记号 

5655；2550276;76545336; 3726755 c 

10. [ M 22] 把等式 （5) 推广成如同 （9) 中那样的混合进制记法。 

II. [22] 给出一个算法，它利用 -2 数系计算 （、… 化以）_ 2 和（ 6，,… 600)-2 之和，得到答案 

( C „ W . QCo ) - 2。 

12. [23] 给出算法， （ a ) 把二进制带符号的数± (〜… a Q ) 2 转换成它的负二进形式 

(乂+ 2… 6 Q )_ 2 ; ( b ) 把负二进数（匕, + 1 ...6 Q )-2 转换成它的带符号的量的形式± (A + l ... ao )2。 

► 13. [ M 2 i ] 在十进数系中有些数有两个无穷的十进展开，例如 2. 3599999… =2. 3600000…。 
负十进制 （-10 进制）系统是否有惟一的展开，或者在这进制之下是否也存在具有两种不同的无 
限展开的实数？ 

14. [ 14 ] 利用正文中所述的方法，在虚四数系中对（11321) 21 做自乘。 
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15. [ M 24 ]对于负十进制和对于虚四数系，什么是类似于图1的集合 5 = 
ISowA -”以为一允许的数字丨？ 

16. [ M 24 ] 试设计一个算法，在 i _ 1数系中，把1加到上去。 

17. [ iW 30] 数 i - 1已经被提议作为数系的进制，但类似的直观上更简单的丨+1却没有，这可 

能显得很独特。能否仅仅利用数字0和1，把每个复数 a + 6 i (其中 a 和6是整数）表示成进制为 
i +1 的定位计数系统？ 


18. [ HM 32] 证明图1中的双龙是包含原点的一个邻域的封闭集（因而，每个复数对于进制 
i - 1都有一个“二进”表示）。 

► 19 . [23 ] (David W . Matula ) 设 D 是 △ 个整数的集合，恰含同余式 x 三 j (modulo 6 ) 的一个解， 
其中 0^ j < b o 证明所有的整数 m (正的，负的或 0) 都可以以形式 m 二 （心…〜八表示，其中所 

有… 在 D 中，当且仅当/范围中的所有整数都可如此表示，其中 /= -maxja U ^ Dl / 

( b ~ l),u = -minU \ aeD \ l(b - 1 ) Q 例如对所有的 6>3， D = | _ 1，0， …， 6 — 2 丨满足条件。 

[提示：设计 一 个算法，使它能构造一■个适当的表 7 K 。] 

20. [ HM 2 S ] (David W . Matula ) 考虑使用数字 D = | - 1，0，8，17，26，35，44，53，62，711 代替 

|0，1，…，9!的十进系统。习题19的结果意味着（和在习题18中一样），所有实数都可用取自 D 
的数字实行无穷十进展开。 


习题13指出，在通常的十进系统中，某些数有两种表示。 （ a ) 找出有两种以上 D - 十进表示 

的一个实数。 （ b ) 证明不存在无穷多个 D - 十进表示的实数。 （ c ) 证明有不可数多个数有两种或 
更多的 D - 十进表 7 K 。 

I 

► 21. [ M 22]( C . E . Shannon ) 是否每个实数（正的，负的或 0) 都能在一个平衡的十进数系中 
表 7 K ，即对于某个整数”和某个序列〜 t ，〜 — 2 ， … ，表示成为的形式。其中每个 


是10个数 

不是允许的数字之一，但我们隐含地假定^ 
不，并求出1的所有表示。 



2 ’ 2 


，1 


,2 


2 


，3 


2 


，4 


2 


中之一（尽管0 


〜 + 2 ，一都是0)。求出0在这个数系下的所有表 


22.[ HM 25] 设 - S ^^ iUT ”' 2 。 给定 f >0以及任何实数 x ，证明有一个“十进”表示使得 
0< . X - 其中每个仅允许是三个值 0，1 或《中之一 。（在 这个表示中没有使 


用10的负次幂！） 

23 . [ HM 30 ] 设 D 是一个6个实数的集合，使得每个正实数都有一个表示 Sk ,, a〆 且所有 
习题20表明，可能有许多实数没有惟一的 表示； 但如果06 D ， 试证明所有这样的数的集 
合了的 测度为0。并证明如果0穿 D ， 这个结论不必成立。 


24. [ M 35 ] 求满足下列三个条件的无穷多个不同集合，其中每个集合包括10个非负整数 ：（ i ) 
gcd ( D ) = l ；( ii ) OGD ； ( iii ) 每个正实数都可表示成形式外10、其中 a , GD 0 


Cook ) 设和是正整数，其中6>2且 


试证 w / w 的6进表 


示在小数点右边任何地方都不包含接连 w 个等于 6-1 的数字（根据约定，在标准的进表示中 
不允许无限多个6-1)。 


► 26. [ HM 30 ] ( N . S . Mendelsohn ) 设〈此〉是对全体整数 n , - 00 < n < + ^o ，有定义的一个实数 
序列，它使得 


^ < Ai + l ； lim^ 7/ - oo ; 


im = 0 

w — oo 
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设〈^〉是对所有整数„ , - co < n < + 00 ，有定义的正整数的任意序列。如果有一个整数》和一 
个整数的无穷 序列〜 ，〜- 1 ，'_ 2 ,…使得，其中〜參 o , o < 〜< 4 ,且对无穷多的々， 

有〜 q ，则我们就说数 I 有一个“广义的表示”。 

试证，每个正实数、 r 恰有一个广义的表示的充分必要条件是，对所有”， A , + 1 = （因 

k n 

此，具有整数基的混合迸制系统都有这一性质；而且具有= (^0 + O /?0^2 = (^1 + 1)(^0 + 

') 口 0,… 1) ，…的混合进制系统是这种类型的最一般的数系。） 

27. [ M 21] 证明每个非0整数都有惟一的“倒转的二进表示，，2% _ 2' 十…十（- 1) T ，其中 

e 0 < q …。 

► 28. [ M 24] 证明形如 a + b \ 的每个非0复数，其中 a 和6是整数，都有惟一的“旋转的二进表 
示” 

(1 + i) e o + i(l + i)^i 一 （1 + i )〜一 i(l + i)S 十…+ "(I 十 i ) 〜 

其中 e 。 < ^… < 匕（参照习题 27) 。 

29. [ iU 35]( N . G . deBruijn ) 设 S Q ， Si ， S 2 ，…是非负整数的集合，如果每个非负整数”都恰有 
一种方式写成形式 

n - 5 0 + 5 j + 5 2 + *** 5 Sj G Sj 

则说汇集丨 So ，^， S 2 , … i 有性质 B (性质 B 意味 着：对 于所有 J ，0 G Sj ，因为” =0仅可表示成0 + 

0 + 0+ …）。具有进制^。，…，^，…的任何混合进制数系都有满足性质^的汇集的例子，为此我 

们只需设 |0， B ; ，…，（匕 —1) 巧1即可，其中尽二6 0 6厂..6厂 1; 这里，表示&十〜&十…以 
一种明显的方式对应于它的混合进制表示（9)。此外，如果汇集丨 S ^， S 2 , … 1有性质 B ， 而且如 
果， A 2 , …是非负整数的任何分划（使得 A。U Ai U A 2 U …=|0，1，2,…丨，且对于, 
A ,. Pl '= 0;某些' 可以是空的），则“塌陷的”集组丨了。，7\，丁 2 , …丨也有性质 B ， 其中：^是取遍 

所有可能的选择 \ GS ,. 的所有和 E ,. ga /,. 的集合。 

试证，任何满足性质 B 的汇集丨了。，：^， r 2 ,--- i 均可通过使对应于一个混合进制数系的某个 

汇集 I S Q , S ,， s 2 ，…丨塌陷而得到。 

30. [ M 39]( N . G.de Bruijn ) -2 进制数系表明，每个整数（正的，负的或 0) 都有形如 

(- 2)^1 + (- 2) e 2 + ■■■ + (- 2)^ , e L > e 2 > *•* > ^ > 0, t > 0 

的惟一表示。本题的目的是探索这一现象的推广。 

a ) 设心，心 ，心 ，…是一整数序列，它使每个整数”都有形如 

77 二 ~ + ~ + …+ ~ ， e Y > 钇 2〉 …〉 ^1 ^ 0 J ^ ^ 0 

的惟一表示（这样的序列〈匕,> 叫做“二进基底”）。证明有一个下标 J ，使得~是奇数，但对于所有 

, b k 是偶数。 

b ) 证明一个二进基底〈\>总能重新排列成形式 d 0 ,2 d x Ad 2 ,- = 〈2 V ，,〉， 其中每个 A 都是 

奇数。 

c ) 如果 b ) 中的每个心，…，，…都是土 1，试证：当且仅当有无限多个+ 1和无限多个 - 1时， 
〈6,,>是二进基底。 

d ) 证明7, - 13.2,7.2 2 ， - 13.2 3 , …， 7.2 2 々 ， - 13.2 2A> + 1 ，… 是二进基底，并求《 = 1的表示法。 
► 31. [ M 35] 2的补的算术的一种推广，称做 “2 -aclic 数”，是由 K . Heasel [ Cre//e 127 (1904),51 

〜 84] 发现的 （ Hensel 事实上处理的是 p - adic 数，其中/>为任何素数）。一个 2- adic 的数可以看做 

二进制数 
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U = - U - 2 "' U _ n ) 2 

且其表示无限地向左展开，但在小数点右边仅有有限多位。 2- adic 数的加法、减法及乘法按照通 
常的算术过程进行，原则上它可以无限地向左边扩展。例如， 

7二 （•■•000000000000111)2 y =(… 110110110110111)2 

-1 = (… 111111111111001)2 - y - (… 001001001001001)2 

+ =(… 000000000000001 . 11)2 Yo = (… 110011001100110 . 1) 2 

=(… 100000010110101)2 或（… 011111101001011)2 
这里，7是通常的二进制整数7,而 -7 是它的2的补（无限地向左扩 展）； 容易证明，当这过程 

无限地继续下去时，通常的二进制数加法过程将给出 -7 + 7 = (‘•■00000)2 = 0。 +和 - j 的值是 

惟一这样的 2- adic 数，当形式地乘以7时，它们分别给出+ 1和的值。| 和&的 值是非 2 -adic 

“整数”的 2- adic 的数的例子，因为它们在小数点右边有非零的数字。的两个值彼此互负，它 
们是惟一的这样的 2- adic 的数，即当形式地平方时，它得到值 

a ) 证明任何 2- adic 的数 w 均可被任何非0的 2- adic 数 r 除，得到一个满足 u = im ; 的惟一的 
2- adic 数 w (因此, 2- adic 数集合构成一个“域”；参考 4.6.1 小节 ） D 

b ) 证明当 n 是一个正整数时，有理数 _ l /(2 n + l ) 的 2- adic 数表示可以以如下方式得 到：首 
先求 + l /(2 n + l ) 的通常的二进制展开，它对于0和1的某个串《有周期形式 （0. a ） 2 ,于是 

- 1/(27? + 1) 就是 2 -adic 数 （… aaa ) 2 o 

c ) 证明2- 3( ^数 w 的表示最终必是周期的（即，对所有大的 N 和某个; l > l , u N+A = u N ) ，其 
充要条件是， W 是有理的（即对某个整数 m 和 72 ， W = m / rO 。 

d ) 试证当 72 为一个整数时是 一 个 2- adic 数的充分必要条件是，对于某个非负整数々，它 
满足 n mod 2 2k + 3 - 2 2 +(于是，可能性是 n mod 8 = 1 或 mod 32 = 4 ， 等等。） 

32. [ M 40 ]( I . Z . Rii2sa ) 试构造无穷多个整数，其三进表示仅用0和1，而且其四进表示仅用 
0，1 和2。 

33. [ iVW 0]( D . A . Klamer ) 设 D 是任何整数的集合，且设6是任何正整数，又设\是对于进 
制6及在 D 中的数字 a , 可以写作 n 位整数的不同整数的个数。证明序列 〈 O 满 
足一个线性递推关系，并说明如何计算生成函数2# 〆 ”。通过说明\是在6 = 3和 D = i _1，0, 
31的情况下的斐波那契数，说明你的算法。 

► 34. [22 ] ( G . W . Reitwiesner ,1960) 使用最少的非零数字，说明怎样以（… i ) 2 的形式表 
示一个特定的整数〃，其中每个~是 -1,0 或1。 

4.2 浮点算术 

在这一节中，我们将通过分析奠定浮点数计算基础的内部机制，来研究对这种 
数进行算术运算的基本原理。也许许多读者对这样的课题兴趣不大，因为他们的计 
算机内已经有浮点的指令了，或者他们的操作系统包括了适当的子程序。但是，事 
实上，这一节的技术不只关系到计算机设计工程师或者为新的机器编写库程序的那 
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部分人，而且每一个熟练的程序员都应当有浮点算术的基本步骤在执行期间是如何 

进行的知识。这一课题并不像大多数人所想像的那样全然是微不足道的，它包含多 

得惊人的有趣信息。 

! 

4 . 2.1 单精度计算 

A . 浮点记法 在 4.1 节我们已经讨论了数的“定点” 记法； 在这种情况下，程序 
员知道在正在操作的数中，假定小数点是在什么位置上。但是从许多目的来看，当 
程序运行时，如果让小数点灵活变动或者“浮动”，并让每个数带一个相应的小数点 
的位置标志，有着很大的方便性。这一想法，在科学计算中已经用了许多年，特别是 
适用于表达像阿伏加德罗常数 A / = 6.02214 x 10 23 这样非常大的数，或者像普朗克 
常数 A = 6.6261 xi(T 27 尔格•秒这样非常小的数。 

在这一节中，我们将 以进制 bH q 、 有 P 位数字的浮点数 来进行 工作。 这样 
的数被表不成一对值 （ e ，/) ，它表示 

(e ，/) = / x b e — q (1) 

这里 e 是有一确定范围的整数，而/是带符号小数。我们约定 

1/1 < 1 

换言之，小数点出现在/的定位表示的左边，更确切地说，关于 p 位数的约定总意 
味着 V /是一个整数，而且 

- b p < b p f < b p (2) 

“浮点二进数”的术语意味着6=2，“浮点十进数”意味着6 = 10,等等。例如，利用8 
位数字的余50的十进数系，我们可以把阿伏加德罗常数 JV 和普朗克常数 / z 分别写 
为 

N = (74, +.60221400) 
h = (24, +.66261000) 

一 个浮点数的两个分量 e 和/分别称 为指数和小数 部分。（有时也使用其它名 
称，主要有“特征阶” （ characteristic ) 和“尾数” （ mantissa ) ;但把小数部分说成尾数乃 

是术语的滥用，因为尾数的概念在联系到对数时有十分不同的含义，而且英语中尾 
数一词指的是“一个微不足道的附加物 ”。 r 

MIX 计算机假定它的浮点数形式是 

± N I / I / I / I / (4) 


卞 在本书第4版作者将改变定义使得|/| <6,这样式 （2) 将变为“ V _ i /< V ”，而式 （5) 将变为“1< 

_/1 <心”，阿伏加德罗常数的余50十进表示将是（73, + 6. 0221400)，等等。其纯粹效果将 是余發 概念的改变， 
在第 3版中的余 g 在第4版中将称为余 9 + 1。这种术语的改变将与 IEEE 标准浮点协定更一致（而且也与 
4.2.2 小节定义的术语 “ ulp ” 相匹配），尽管 （21) 〜 （24) 的定义将稍稍凌乱些。——本书责编译自 “Errata to 

Volume 2” 
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这里我们用精度为四个字节的进制 b 佘 q 的浮点记法，其中6是字节大小（例如6 
= 64 或6 = 100) ， 而 g 小数部 分是土 ffff ， 丽 e 是指数，它处于范围 0 <e 

< b 之中。在大多数现有的计算机中，这个内部表示是典型的约定，但这里6比通 
常的进制大得多。 


B . 规格化计算 如果/的表示的最高位非 0, 从而 

lib < |/| < 1 (5) 

或者如果/=0且 e 有它的最小的值，则说一个浮点数 U ,/) 是规格化的。通过首先 
比较两个规格化浮点数的指数部分，而后仅当指数相等时才检查小数部分，能够指 
出这两个数中哪一个具有更大的绝对值。 

现在使用中的大多数浮点程序几乎全都处理规格化 的数： 对程序的输入假定为 


规格化的，而且输出总是规格化的。在这些约定之下，我们就失去了表示 


些非常 


小的量的能力 


例如值(0，. 00000001) 如不产生一个负指数就不能规格化 



我们获得了速度、一致性，以及在计算中对相对误差给出相对简单的界的能力（非规 
格化浮点算术在 4.2.2 小节讨论）。 

现在来详细研究浮点算术的操作。同时我们可以考虑构造这些操作的子程序， 


这里假定我们的计算机没有内部的浮点硬件。 

浮点算术的机器语言子程序通常都编写得非常依赖于机器，它们使用该计算机 
的许多最原始的 特性； 因此，从表面上看，两台不同的机器的浮点加法子程序往往很 
不一样。但是，仔细研究二进制和十进制计算机两者的许多子程序就会发现，这些 
程序实际上有许多共同点，而且有可能在一种不依赖机器的方式下来讨论这些课 


题。 

在这一节中我们将要讨论的第一个（而且是最最困难的一个）算法，是进行浮点 
加法的一个 过程： 


(〜， /“） ㊉ （〜， A ) 二 



( 6 ) 


由于浮点算术本身固有地是近似的，不精确的，我们将使用“圆”符号 


©,©,©, 0 

来分别表示浮点的加、减、乘、除，以便把近似运算同真正运算相区别。 

关于浮点加法的基本思想是十分简单的：假定，我们取‘ =^，九=人 

+九/纟1~(从而调整小数点位置，以进行有意义的加法），并把结果规格化。可能 

出现若干情况，而使这个过程显得颇不平凡，下面的算法更精确地说明了这个方法。 


算法 A (浮点加法） 给定进制 b ，条 q ， p 位规格化的浮点数 w == ( ，/ w )和 I ；= 

(匕，/；.)，本算法形成和 w = 对于浮点减法可使用同样的算法，只须以 - i ； 替 

mv 即可。 

A1. [拆开]分开 u 和 I ；表示的指数和小数部分。 

A 2 .[假定 e u ^ e v ] 如果~<<^，则交换^和 u ( 在许多情况下，最好是把步骤 
. 194 • 



4.2 浮点算术 


A 2 和步骤 A 1 或者与后边的某些步骤合并在一起）。 

A 3 •[置〜]置〜―〜。 

A 4 .[测试〜 - 〜]如果〜 + 2( 指数的差很大）则置九―人，并转到步 

骤 A 7。 （实际上，由于我们假定〃是规格化的，所以我们本来可以就此结 
束这个算法，但是要是能通过加0来对一个可能是非规格化的数进行规格 

化，有时是有用的。） 


A 5 .[右调]把 人右移 个位置，即用来除它。[注：这样至多进行 

十1位的移位，而且因此下一步（把 A 加到 A ) 就要求有一个累加器，能用 

于保存小数点右边的 2 p + UtLb 进数字。如果没有这么大的累加器可用， 
只要预先采取适当的措施，也可以把要求缩短到只保存 p + 2位或 f + 3 


位。其细节在习题5中给出。. 
A 6 •[相加 ] S fcu^fu + fvo 


A 7 •[规格化](这时 


，/ w ) 表亦 w 和的和，但 I 人 I 可能有多于 P 位的数字， 


而且它可能大于1或小于 1 M 。） 实施以下的算法 N ， 规格化和舍入（^， 


/ m )， 成为最后的答案 。I 


Y 



图2浮点加法 

算法 N (规格化）“未加工的”指数 e 和“未加工的”小数/被转换成规格化的形 

式，必要时把它舍入成 > 位数字。本算法假定|/|<6。 

N 1. [测试 /] 如果|/|>1(“小数上溢”），则转到步骤如果/=0,则置 e 

成为其最小可能值，并转到步骤 N 7。 


N 2. [/ 已规格化？]如果 I /I >1/6,则转到步骤 N 5。 

N 3 .[左调]把/左移一位（即乘以6)，并把 ，减 1，返回步骤 
N 4 .[右调]把/右移一位（即以6来除它），并把 e 加1。 
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N 5 •[舍人]把/舍人成位。（我们这样做意味着把/变成的最接近的倍 

数。有可能（ V /) mod 1 = 士，因而有两个最接近的 倍数； 如果6是偶数，选 

择把/变成最接近的倍数/使得 + 为奇数。关于舍入的讨论， 

见 4.2.2 小节。）重要的是，这里的舍入运算可以使|/| = 1(“ 舍入上溢 ”）; 
在这种情况下，返回步骤 N 4。 

N 6 •[校验 d 如果 e 太大，即大于它所允许的范围，则建立 指数上 溢标记。如 
果 e 太小，则建立指 数下溢 标记。（见以下的 讨论； 由于结果不能表示成所 
要求范围内的规格化浮点数，因此需要特殊的动作。） 

N 7. [归拢]把 e 和/合在一起，构成符合输岀要求的表示。 ■ 



习题4中给出了浮点加法的某些简单的例子。 

下面的 MIX 子程序是做形如 （4) 的数的加法和减法的，它说明算法 A 和 N 可以 

怎样表达成计算机程序。以下的子程序被设 计成： 在进入子程序时从符号单元 ACC 

取一个输入《，又从寄存器 A 取另一个输入 I ；。输出 u ； 既出现于寄存器 A 中，也出 
现于单元 ACC 中。于是，定点代码序列 

LDA A ； ADD B; SUB C; STA D (7) 

对应于下列浮点代码 序列： 

LDA A, STA ACC; LDA B, JMP FADD; LDA C, JMP FSUB; STA D (8) 

程序 A (加法 ，减 法和规格化） 下列程序是实现算法 A 的一个子程序，而且已 

把它设计成使得规格化部分亦可为出现在这一节后边的其它子程序所使用。在这 

个程序中以及贯穿于这一章的许多其它的程序中， OFLO 都表示一个这样的子程序， 

它打印出一个信息，告知 MIX 的溢出标记已意外地被发现是接通的。字节大小办假 

定是 4 的倍数。规格化子程序 NORM 假定 rI 2 = e 和 rAX = /，其中 rA = 0意味着 rX 
= 0和 rI 2<6。 
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00 

BYTE 

EQU 

1(4:4) 

01 

EXP 

EQU 

1:1 

02 

FSUB 

STA 

TEMP 

02 


LDAN 

TEMP 

OU 

FADD 

STJ 

EXITF 

05 


JOV 

OFLO 

06 


STA 

TEMP 

07 


LDX 

ACC 

08 


CMPA 

ACC(EXP) 

09 


JGE 

IF 

10 


STX 

FU(0 ： 4) 

11 


LD2 

ACC(EXP) 

12 


STA 

FV(0 ： 4) 

13 


LD1N 

TEMP(EXP) 

U 


JMP 

4F 

15 

1H 

STA 

FU(0 ： 4) 

16 


LD2 

TEMP(EXP) 

17 


STX 

FV(0 ： 4) 

18 


LD1N 

ACC(EXP) 

19 

4H 

工 NCI 

0,2 

20 

5H 

LDA 

FV 

21 


ENTX 

0 



SRAX 

0,1 

23 

6H 

ADD 

FU 

2Jp 


JOV 

N4 

25 


JXZ 

NORM 

26 


LD1 

FV(0 ： 1) 

27 


JAP 

IF 

28 


JIN 

N2 

29 


JMP 

2F 

30 

1H 

J1P 

N2 

31 

2H 

SRC 

5 

32 


DECX 

1 

33 


STA 

TEMP 

3i 


STA 

HALF(0 ： 0) 

35 


LDAN 

TEMP 


字节大小 b 
指数字段的定义 
浮点减法子程序 
改变操作数符号 
浮点加法子程序 
确保溢出标记关闭 

TEMP— z ； 

rX— w 

这里把步骤 A 1, A 2， A 3 合并 
如果 e 》 e u ，则转移 

™ —土////0 

rI 2 

rll — _ 心 

+ //// OU ， z ； 交换） 

rI 2 —心 
rll ^- - e v 

rll — （步骤 A 4 不必要) 
A 5 ‘右调 

清 rX 

右移 - e v 位 

A 6 •加 

A 7 .规格化 。 若小数卜溢 Q3II 转救 

是容易的情况？ 

检查相反的符号 

若不是，规格化 


lrX |-| rA | 

( rX 为正的） 

(操作数有相反的符号， 

在舍入和规格化之前寄存器 
必须调整） 
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36 


ADD 

37 


ADD 

38 


SRC 

39 


JMP 

40 

HALF 

CON 

kl 

FU 

CON 


FV 

CON 

us 

NORM 

JAZ 

u 

N2 

CMPA 

i5 


JNE 


N3 

SLAX 

47 


DEC2 

If 8 


JMP 


N4 

ENTX 

50 


SRC 

51 


INC2 

52 

N5 

CMPA 

53 


JL 

5Jf 


JG 

55 


JXNZ 

56 


STA 

57 


LDX 

58 


JXO 

59 

5H 

STA 

60 


INCA 

61 


JOV 

62 

N6 

J2N 

63 

N7 

ENTX 

6Jf, 


SRC 

65 

ZRO 

DEC2 

66 

8H 

STA 

67 

EXITF 

J2N 

68 

EXPOV 

HLT 

69 

EXPUN 

HLT 

70 

ACC 

CON 


HALF 

HALF 

5 

N2 

1//2 

0 

0 

ZRO 

= 0 = ( 1 : 1 ) 

N5 

1 

1 

N2 

1 

1 

1 

= BYTE/ 2 = (5:5) 

N6 

5F 

5F 

TEMP 

TEMP(4 ： 4) 

N6 

* + 1 ( 0 : 0 ) 

BYTE 

N4 

EXPUN 

0,2 

1 

BYTE 

ACC 

* 

2 

■ 

i 

0 


低有效位部分求补 
转移到规格化子程序 

字大小的一半（符号改变） 

小数部分 A 

小数部分/； 

N 1. 测试 f 

N 2 .f 是规格化的吗? 

如果前导字节非零，则转 N 5 
N 3 . 左 调 

，减 1 

返回 N 2 
N 4 •右调 

右移，插入带适当符号的“1” 
e 加1 

N 5 ■舍入 

I 尾部 I <(1/2)6 吗？ 

I 尾部 I >(1/2)6 吗? 

I 尾部 I =(1/2)6; 舍入成奇数 

如果 rX 为奇数，则转 N 6 
存 rA 的符号 

加到|/|上（符号改变） 
校验舍入上溢 

N 6 .检验 e 。 若 e <0, 则下溢 
N 7 .归拢。 rX^e 


rl2^*—e — b 

跳出，除非 e^b 
发现指数上溢 
发现指数下溢 
浮点累加器 
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行26 〜 40的代码部分是长了一点，但这是需要的，因为 MIX 只有一个5字节累 
加器可用于带符号数的相加，同时算法 A —般地要求精度为 2 p + l = 9 个位置。如 
果我们愿意牺牲一点它的精度，这个程序就可以缩短大约现有长度的一半，但我们 
在下一节将看到，充分的精度是重要的。第58行使用在 4.5.2 小节中定义的非标 
准 MIX 指令。浮点加法和减法的运行时间依赖于在 4.2.4 小节中分析的若干因素。 

现在让我们研究乘法和除法，它们比加法更简单，而且它们彼此有些类似。 

算法 M (浮点乘法和除法） 给定进制余(?，/>位数表示的规格化浮点数“= 
(〜， A ) 和 v — y fv ) o 本算法形成乘积或商0 T ；。 

Ml . [拆开]把 w 和表示的指数和小数部分分开（有时在这 一 步中测试操作 

数是否为0是方便的，但不是必要的）。 

M 2 •[运算]置 

^ e u ^ e v ~ q y f w fj v (对于乘法） 

(9) 

e w ^ e u ~ q -\- I , f w ( b~ l f u )1 f v (对于除法） 

(因为假定了输人数是规格化的，由此推出 ，九 = 0或1/6 2 < | /J < 1，或 
者已出现了除以0的错误。）如果必要，这时可以缩短成/>十2位或户+ 
3位数字，如同习题5中那样。 

M 3 .[规格化]对（〜，九）实施算法 N ， 以规格化、舍入和归拢结果。（注 ：在这 

种情况下，规格化是比较简单的。因为左调顶多出现一次，而在除法之后， 
不会出现“舍人溢出 ” D ) ■ 

以下的 MIX 子程序可与程序 A 联合使用，它说明与算法 M 有关的必需的关于 
机器方面的考虑。 


程序 M (浮点乘法和除法) 


01 

Q 

EQU 

BYTE /2 

02 

FMUL 

STJ 

EXITF 

03 


JOV 

OFLO 

0 U 


STA 

TEMP 

05 


LDX 

ACC 

06 


STX 

FU (0：4) 

07 


T , D 1 

TEMP ( EXP ) 

08 


LD 2 

ACC ( EXP ) 

09 


INC 2 

- Q，i 

10 


SLA 

l 

11 


MUL 

FU 

12 


JMP 

NORM 

13 

FDIV 

STJ 

EXITF 

U 


JOV 

OFLO 


g 是字节大小之半 
浮点乘法子程序 
确保上溢标记关闭 

TEMP — 

rX— u 

FU —±////0 


r!2^~e u + e v — q 

L 乘以人 

规格化，舍人并跳岀 
浮点除法子程序 
确保清除溢出标记 
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15 

STA 

TEMP 

16 

STA 

FV(0 ： 4) 

17 

LD1 

TEMP(EXP) 

18 

LD2 

ACC(EXP) 

19 

DEC2 

-Q,i 

20 

ENTX 

0 

21 

LDA 

ACC 

22 

SLA 

1 

23 

CMPA 

FV(1 ： 5) 


JL 

* + 3 

25 

SRA 

1 

26 

工 NC2 

1 

27 

DIV 

FV 

28 

JNOV 

NORM 

29 DVZRO 

HLT 

3 


TEMP— v 


FV— 士 ffffO 


rI 2 —心 ~ e v + q 


rA — 人 

如果 l /」< I A I 则转移 
否则，右调 A 
并把 rI 2 加 1 
除 

规格化，舍入和跳出 
没有规格化或以0作除数 | 


这个程序最值得注意的特性是在行23 〜 26中进行除法的措施，这样做是为了 
确保舍入后的答案有足够的精度。如果|人|< I / J ，则直截了当地应用算法 M 将 

在寄存器 A 中保留形如“ ±0////”的结果，而如果不对余数进行仔细的分析，就不 
能够进行正确的舍人(余数出现在寄存器 X 中 h 所以在这种情况下，这个程序计算 
九 —人 / A ， 并确保在所有情况下九或者为0,或者是规格化的。舍入可对5个有 

效字节进行，并且可能测试余数是否为0。 

我们有时需要进行定点和浮点表示之间的转换。“定化浮”的转换程序借助于 
上边的规格化算法容易得到。例如，在 MIX 中，下列子程序把一个整数转换成浮点 
数的 形式： 


01 

FLOT STJ 

EXITF 

02 

JOV 

OFLO 

03 

ENT2 

Q + 5 

Ob 

ENTX 

0 

05 

JMP 

NORM 


假设 rA = w ，一 个整数 
确保清除溢出标记 
置未加工的指数 

规格化，舍入并跳出 I 


( 10 ) 


“浮点化定点”子程序是习题14的课题。 

浮点子程序的排错通常是一项困难的工作，因为需要考虑很多情况。这里是一 

份通常易于出错的“陷阱”的清单，这些“陷阱”常常使设计浮点程序的程序员或机器 
设计者落人圈套。 

1) 丟失符号。 在许多机器上（不是 MIX )， 寄存器之间的移位指令将影响符号，因 
此必须仔 a 地分析用于规格化和左调或右调的移位操作。当岀现负0时，符号也屡 
被丢失（例如，程序 A 在行33〜37中小心地保留寄存器 A 的符号，也见习题6)。 
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2) 没有适当地处理指数上溢或下溢。 只有在舍人和规格 化之后 ，才能校验〜 

的大小，因为先期测试可能给出一个错误的指示。指数下溢和上溢不仅在做浮点乘 
法和除法时可以出现，在做浮点加法和减法时也可 出现； 而且即使出现得很少也必 
须每次加以测试。在出现上溢或下溢之后，应保留足够的信息使得有可能采取有意 
义的改正动作。 

可惜的是，在许多情况下人们已经习惯于忽略指数的下溢并简单地把下溢的结 
果置成0,而不给出出错标志。这在大多数情况下引起了精度的严重损失（其实是 
损失了所有的有效位），并且破坏了奠定浮点算术的假定，所以当出现了下溢时，必 
须实际地告知程序员。只有在某些情况下，当结果以后要被加进一个相当大的量 
时，把结果置成0才是适当的。如果对指数的下溢不加检测，我们会发现不可思议 
的情况，即为 0, 但 W ②则不然，因为使指数下溢，但仍可计 
算 M ③而不使任何指数越出范围之外。类似地，如果不去检测指数下溢，则 
我们可以找到正数和3；，使得 

3 (11) 

(a ㊉ 6 ( Z ) y ) (c ㊉ d 0 y ) = I 

(见习题 9。） 即使浮点程序不是完全精确的，当和^都是正数时，像 （11) 这 
样的矛盾也是十分意外的！程序员通常不预先处理指数下溢，所以关于这点应该告 
知他， 

3) 插入无用信息。 当左调时，重要的是要防止在右边引进除0外的任何东西。 
例如，注意程序 A 第21行中的 “ENTX 0”指令以及在 FLOT 子程序 （10) 的行04中的最 

易于忘记的 “ENTX 0”指令。（但在除法子程序中的行27之后清除寄存器 X 将是一 
个错误。） 

4) 非预见的舍入溢出。 当类似 . 999999997 的数被舍人成8位时，在小数点左 

边将出现一个进位，因而结果必须右调。许多人都错误地下结论说，做乘法时舍人 
溢出是不可能的，因为他们看到 I 人/； I 的极大值是1 -26 1 因而这不能舍 

人成1。这个推理的错误在习题11中示出。奇妙的是，在浮点除法过程中却不会出 


* 另一方面，我们必须承认，今天的髙级程序设计语言对于如何利用一个浮点程序要提供的信息，没有向 
程序员介绍令人满意的方法，或者只介绍很少的方法。本节中的 MIX 程序，当发现错误时，它干脆停机，这甚至 
更坏。在许多重要的应用中指数下溢是相对无害的，因此对于程序员来说，找出容易的和安全的对付这种情况 
的方法是值得的。径直用零代替下溢的做法已绝对地被怀疑。但还有另一个选择，它近来已经深受欢迎，这就 
是修改我们对于浮点数已经给出的定义。当指数有它最小可能的值时，允许有一个未规格化的小数部分。这 
个“逐渐下溢”的思想首先体现在 Electrologica X 8 计算机的硬件上。它仅仅对算法增加少量的复杂性，而且使 
得在加法或减法期间下溢不可能出现。在存在有“逐渐下溢”的情况下 4.2.2 小节中关于相对误差的简单公式 

不再成立，所以这个题目超出了本书的范围。但是使用像 round ( ) =工（1-5) + <，其中|&|< 6 1 -和 

、 | <6^/2,这样的公式，人们能够证明在许多重要情况下逐渐下溢是成功的。见 W . M . Kahan 和 J . 
Palmer , ACM SIGNUM Newsletter (1979 年 10 月）， 13 〜 21。——作者原注 
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现舍入溢出的现象（见习题12)。 

有一种学派说，把像 .999999997 这样的值舍入成 . 99999999而不是 1.0000000 
是无害的，因为这不增加相对误差最坏情况的界。浮点数1.0000000。可以说代表 
了区间 [ 1 . 0000000 - 5 X 10 — 8 ，1 . 0000000 + 5 X 10- 8 ] 中的全部数，而. 99999999代 

表在小得多的区间 （.99999999 - 5 x 10 _9 ,99999999 + 5 x 1 CT 9 ) 中的所有数。尽管 

后一区间不包含原来的.999999997,但后一区间的每一个数都包含在头一个区间当 
中，所以用第二个区间做以后的计算不会比第一个不精确。但是这个巧妙的论断同 
在 4.2.2 小节中所表达的浮点算术的数学原理不相容。 

5) 规格化之前舍入。 不精确来自过早地在错误的数字位置上进行舍入。当舍 
入在适当位置的左边进行时，这个错误是明 显的； 但在不大明显的情况下，即先在右 
边很远的地方进行舍入然后再在正确的位置舍入，那也是危险的。由于这一原因， 
在步骤 A 5 的右调操作过程中进行舍入是错误的，除非像习题5所给出的那样。（但 
是在 N 5 中舍人的特殊情况下，当出现了舍入溢出之后再次进行舍入，却是无害的， 
因为舍人溢出总产生± 1.0000000,而这样的值不受以后的舍入过程的影响。） 

6) 在中间计算中没有保留足够的精度。 下节进行的浮点算术的精确度的详细 
分析，有力地提示了规格化浮点程序应当总是产生适当地舍人的结果。产生这一论 
断应该没有什么例外，即使是在出现概率极小的情况下也是这样。如同在算法 A 和 
算法 M 中所指出的那样，在整个计算过程中，都应该保留适当个数的有效数字。 

C . 浮点硬件 几乎每一台用于科学计算的大型计算机，都包含浮点算术作为它 
内部操作的指令表的一部分。可惜这样的硬件设计通常总有些毛病，它在某些情况 
下引起可怕地拙劣的性能。因此我们希望未来的计算机设计者们能比过去更加注 
意为计算机提供适当的性能。这只需多花不多的钱来造出正确的机器，而下一节的 
一些考虑表明得到的好处却很大。就我们现在所知来说，过去的折中妥协对于现代 
的机器不再是合适的了。 

MIX 计算机在本套书中是当做“典型”机器的一个例子，它有一套包括以下7个 
操作的任选的“浮点附件”（另付费用可买 到）： 

• FADD ， FSUB ， FMUL ， FDIV ， FLOT，FCMP (分别有 C=1 ， 2,3,4,5,56;F=6 )。 在 

"FADD V ”操作之后 rA 的内容和经过操作 

STA ACC ； LDA V ； JMP FADD 

之后 rA 的内容完全相同，其中 FADD 是在这节前边出现的子程序。不同之处是，如 
果两个操作数在进入子程序之前还不具规格化的形式，则它们都将被自动地进行规 
格化（在进行这个预先的规格化期间而不是在对答案进行规格化期间出现指数下 
溢，则不给出下溢标志）。类似的说法，亦可应用于 FSUB ， FMUL 和 FDIV 。 在执行 
“ FLOT ” 操作之后， rA 的内容是执行上述子程序 （10) 中的 “JMP FLOT ” 后的内容。 

rA 的内容经 “FCMP V ”操作后不变，这条指令依赖 rA 的内容是否“确定地小于”， 
“近似地等于”或“确定地大于” V 的内容，而把比较指示器置为 LESS , EQUAL 或 
GREATER 。 下节将讨论这个课题。而且其确切的动作由习题4 . 2 . 2_ 17的子程序 
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FCMP 定义，其中 EPSILON 在单元 0 中。 

rA 以外的寄存器均不受任何浮点操作的影响。如果出现指数上溢或下溢，则 
置上溢出标记，而且答案中的指数是以模字节大小的形式给出的。以0做除数在 
rA 中产生无定义的无用信息。执行时间分别为 4 u ，4 u y 9 uMu^u ,4 u 0 

• FIX ( C =5; F =7) 0 rA 的内容用整数 “ roun d ( rA )” 来代替，像在算法 N 的步骤 

N 5 中那样舍人成最接近的整数。然而如果这个答案太大，在寄存器中装不下，则置 
溢出标记且结果无定义，执行时间为3^。 

有时以非标准的方式来使用浮点操作是有帮助的。例如，如果操作 FLOT 未被 
作为 MIX 的浮点附件的一部分包括进来，则编写 

FLOT STJ 9F 

SLA 1 

ENTX Q + 4 (12) 

SRC 1 
FADD = 0 = 

9H JMP * | 

就能容易地实现它对 4 字节数的作用。这个程序并不严格地等价于 FLOT 操作，因 
为它假定 rA 的 1:1 字节为 0, 而且它会破坏 rX 。 处理更一般的情况有点窍门，因为 
甚至在一个 FLOT 操作期间也可能出现舍人溢出。 

类似地，假设 MIX 有一个 FADD 操作，但没有 FIX 操作。如果我们要把一个数 w 

从浮点形式舍人成为最接近的定点数，而且如果我们知道这个数是非负的，并且至 
多占据三个字节，则可以写 

FADD FUDGE 

其中 FUDGE 包含常数 



rA 中的结果将是 

(13) 

D •历史和文献 浮点记法的起源可追溯到巴比伦时代（公元前1800年或更早 
些）的数学家们，他们广泛使用60进制的浮点算术，但没有关于指数的记法。进行 
这些计算的人们对于指数应该是什么好像总是“清楚”的。虽然至少已经发现了一 
个例子，说明由于在实施加法时不适当地调整操作数，因而给出了错误的答案，但这 

种例子是很稀少的；见 O , Neugebauer，The Sciences in Antiquity ( Princeton ， N . 

J ‘ : Princeton University Press , 1952) ， 26 〜27。对于浮点记法另一个早期的贡献应 

归功于希腊数学家 Apollonius (公元前3世纪），至少在一些简单情况下，他显然是第 

一 个说明怎样分别地从10的幂的系数来累加这些幂以简化乘法的人。[关于 Apol ¬ 
lonius 方法 的讨论 ，见 Pappus ， Mathematical Collections (公元4世纪）。]在巴比伦文 



• 203 . 





第 4 章算术 


化消亡以后，直到很晚，大约在发明对数 （1600 年）及不久之后 Oughtred 发明计算尺 
(1630 年）之前，积和商的浮点记法一直很少使用。大约同一时间，引进了指数的现 
代记号“/”；在这以前，已经使用了工的平方，: r 的立方等符号。 

浮点算术已被某些最早的计算机的设计所采用。1914年 ， Leonardo Torres y 
Quevedo 在马德里，1936年 Konrad Zuse 在柏林，1939年 George Stibitz 在新泽西，都 
独立地提出了它。 Zuse 的机器使用他称做半对数记号的浮点二进表示，还可以处理 
像“〜”和“无定义”这样的特殊量。用浮点算术硬件进行操作的头一台美国计算机 
是贝尔实验室的 Model V 和哈佛大学的 Mark II ，这两台机器都是在1944年设计的 
继电计算器。[见 B . Randell , The Origins of Digital Computers ( Berlin ： Springer , 
1973) , 100 , 155 , 163 〜 164,259 〜 260 ;Proc . Symp . Large-Scale Digital Calculating Ma ¬ 
chinery ( Harvard , 1947 ),41 〜 68 ， 69 〜 79 ; Datamation 13 (1967 年 4 月 ） ， 35 〜 44 
( 1967年5月 ） ，45〜49 ; Zeit . fur angew . Math , und Physik 1 (1950),345 〜346。 ] 

在 1944 年一 1946 年期间，穆尔学校的研究者们在制造头一台电子数字计算机 
的计划中，极认真地考虑了浮点二进制算术的用法，但他们发现，以电子管来实现浮 
点线路比起用继电器来更困难得多。这个小组认识到，调整比例在程序设计中是个 
问题; 但他们知道在那时它不过是整个程序设计工作中很小的一 部分； 确实，明确的 
定点比例似乎值得花费时间和气力来做，因为它使程序员对所得数值的精确度保持 
了解。其次，机器的设计者论断说，浮点表示将耗费大量宝贵的存储空间，因为必须 
存储指数，而且对于多精度计算釆取浮点算术运算是困难的。[见 von Neumann , 
Collected Works 5 (New York : Macmillan , 1963)，43，73 〜74。 ] 当然，这时候他们正在 

设计头一台存储程序计算机以及第二台电子计算机，而他们的选择不得不或者采用 
定点，或者采用浮点，而不是两者兼用。他们已先期编制了计算浮点二进数的子程 
序，而且事实上把“左移”和“右移”指令放进他们的机器中，主要是为了使这样的子 
程序更为有效。在硬件中同时具有两种类型的算术运算的头一台机器显然是通用 

电子公司 （General Electric Company ) 研制的 一 台计算机[见 Proc . 2 nd Symp . Large - 
Scale Digital Calculating Machinery ( Cambridge , Mass . : Harvard University Press , 

1951),65 〜 69]。 

早期机器的浮点子程序和解释系统是由 DJ . Wheder 和其他一些人编码的，这 

些子程序首先发表在 Wilkes,Wheeler 和 Gill 所著的 TT^e Preparation of Programs for 
an Electronic Digital Computer 上 （ Reading , Mass . : Addison - Wesley , 1951) ，子程序 A 1 

〜 All ，35 〜 37,105 〜 117。有趣的是，这里描述了浮点十进算术运算，尽管所使用的 
是一台二进制的计 算机； 换言之，数被表示成 107 \而不是 27 \因此调整比例操作需 
要乘以10或除以10。在这台具体的机器上这种十进制的调整比例大约就像移位那 
样容易，而且十进方法大大地简化了输入输出转换。 

大多数涉及浮点运算程序细节的公开文献，都散见于各计算机厂家分发的技术 
备忘录中，偶尔也出现在公开的著作中。除了上述的文献外，下面一些是有历史价 
值的： R . H . Stark 和 D . B . MacMillan , Math . Comp . 5 (1951) ,86 〜 92,其中描述了 一^ 

个线路板程序 ； D • McCracken ， Digital Computer Programming ( New York : Wiley , 
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1957) ， 121 〜 131;J.W. Carr III，CACM 2,5(1959 年 5 月）， 10 〜 15 ; W. G. Wadey, 
JACM 1 (1960) ， 129 〜 139; D.E.Knuthi，/ACM 8 ( 1961 ) ， 119 〜 128 ; 0‘ Kesner ， 
CACM 5 ( 1962) ， 269 〜 271; F . P . Brooks 和 K‘ E. I verson, A u toma tic Data Processing 

(New Y 0 r k : Wi [ ey ，1963)，184 〜199。关于从计算机设计者的观点进行浮点算术的 

讨论，见 W . Buchholz 所编 P/arming a Computer Sys tem [(New York ： McGraw - Hill , 
1962)，92 〜 121] —书中 S . G . Campbell 写的 “Floating point operation ” ； A . Padegs ， 
IBM Systems J . 1 (1968 )，22 〜29。另外一些主要涉及浮点方法精度的文献，在 
4.2. 2小节中给出。 

在20世纪80年代末，当大多数厂家开始采用 ANSI / IEEE 标准754之后，在浮 
点硬件方面发生了革命性变化。有关的文 献是 ： IEEE Micro 4 ( 1984 ) ，86〜100; 

W . J . Cody , Comp . Sd . ancf St 5 tisties : Symp . on the Interface 15 (1983), 133 ~ 139; W . 
M . Kahan , Mini/Micro West ~83 Coni . Record (1983)， 论文 16/1; D . Goldberg ， Com ¬ 
puting Surveys 23 (1991) ， 5 〜 48 ， 413 ; W ‘ J . Cody 和 J . T . Coonen , ACM . Trans . 
Math . Software 19 (1993) ,443 〜 451 。 

4 将在本书的下一版中替代 mx 的 mix 计 算机，自然地将符合新标准。 

习题 


1 . U 0] 怎样以100进制，余量50,四位浮点记法表示阿伏加德罗数和普朗克常数（如果字节 
大小为100,则像在 （4) 中那样，这将是 MIX 所使用的表示）？ 

2. [12] 假设指数 e 限定在的范围中，能写成6进制，余位数字的浮点数的最 
大和最小正值是多少？在这些规定下，可以写成规格化的浮点数的最大和最小正值是什么？ 

3. [ Ji ]( K . Zuse ,1936) 证明，如果使用规格化的浮点二进算术运算，则有一个办法可以稍稍 
提高精度而不损失存储空 间：即 如果指数值的范围减少一点点的话，则可仅用 p -1 位来表示 p 
位小数部分。 

^4.[16 ] 假定 b = 10, p ^ S o 对于（50, + .98765432) ㊉ (49, + . 33333333) ，算法 A 给出什么结 
果？对于（53，- .99987654) ㊉ （54, + .10000000) 呢?对于 （45 ，— . 50000001 ) ㊉ （54 ，+ . 10000000) 
呢？ 

► 5. [24] 我们说^ 〜 (关于一个给定的进制幻的充分必要条件是，: c 和^是满足下列条件的 
实数： 

LxM 」 = L ： y/ 厶」 

x mod 6=0 ㈡ y mod 6 — 0 

0 < 工 mod b < -^-b ㈡ 0 < ^ / mod b < -^~b 


x mod 6 = 



^ y mod b ― 



b 


< x mod b 〈 b ^ < y mod b 〈 b 

证明如果在算法 A 的步骤 A5 与 A6 之间以 b ^- 2 F v 代替人 ，其中 〜沪 + 2 人 ，则该算法的结果 
将不变。（如果是一个整数而6为偶数，这一操作实际上把 人截成 /> +2位，同时记住是否有 
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任何非零数字被去掉了，因此步骤 A 6 中进行加法所需要的寄存器长度达到极小 J 

6. [20] 如果一个 FADD 指令的结果为0,则按照本节中给出的 MIX 浮点指令的定义 rA 的符号 
为何？ 

7. [27] 利用平衡的三进制系统，讨论浮点算术运算。 

8. [20] 假定指数必须满足 0< e <100, 试给出规格化的8位数字的浮点十进数 w 和对于 
它们，加法产生 （ a ) 指数下溢， （ b ) 指数上溢。 

9. [ M 24]( W . M . Kahan ) 假定在指数下溢时以0来代替结果，同时又不给出错误指示。试利 
用余0,8位数字的，且 e 在范围 -50< e <50 内的浮点十进数，找出使得 （11) 成立的正的 a ， b ， c ， 

d 和: V 的值。 

10. [12] 给出规格化的8位数字的浮点十进数 w 和!；的一个例子，使得它们在加法中出现舍 
人溢出。 

kll .[ M 20] 给出规格化的余50的8位数字的浮点十进数 W 和 I ；的一个例子，使得它们在乘 
法中出现舍人溢出。 

12. [ M 25] 证明在浮点除法的规格化阶段中不能出现舍入溢出。 

13-[30] 在“区间算术”中，我们不对浮点计算的结果实行 舍入； 而是要实现像▽和 A 这样的 
运箅，它们给出对于真正的和最严格的可表示 的界： 

u ^ v u + v ^ U A v 

为此目的，本节的算法应做怎样的修改？ 

14. [25] 写出一个 MIX 子程序，它从寄存器 A 中的任意浮点数（不必是规格化的）开始，并把 
这个数转换成最接近的定点整数（或者确认其绝对值太大，从而不可能来做这样的转换）。 

► 15. [28] 写出一个 MIX 子程序，对于给定的浮点数 W ，它能在这一节的其它子程序的帮助下， 

计算即计算 w - Lu 」 并舍入到最近的浮点数。注意，当 w 是一个非常小的负数时 ， u 

1可能被舍入成为结果是1的数（即使1已定义成总是小于1的一个实数，也不例 

外）。 

16. [// Af 2 l](Robert L . Smith ) 给定实的浮点值 a ， b 、 c 和心试设计一个计算复数 U + 6 i )/ 
(c + 心）的实部和虚部的算法。避免计算 e 2 + /，因为它将引起浮点溢出，甚至当 | c | 或 | 是允 
许的极大浮点值的近似平方根时，也是如此。 

17. [40] (John Cocke ) 定义一种单字长表示，在这种表示下，其小数部分的精度随指数量度的 
增加而减少。由此探讨推广浮点数的范围的思想。 

18 . [25 ] 考虑字长36位的 一 台二进计算机，其正浮点二进数表示为 （ Oe /2 … \fi … 

这里… 0)2 是一个余 （10000000)2 的指数，而（乃必…/ 27 ) 2 是一个27位的小数。负的浮点 
数用相应正表示的2的补码给出（见 4. 1节）。因此 1. 5在八进记法下是201 | 600000000,而 
-1.5 是576 | 200000000; 1 . 0和 - 1 . 0的八进表示分别为201 | 400000000和576 | 400000000( 这 
里的垂直线用来表示指数和小数部分的界）。注意 ，一 个规格化的正数的位，必为1，而对于负 
数它几乎总为0;例外情况是2〃的表示。 

假设一个浮点运算的准确结果有八进码572 | 740000000 | 01;这（负的 ）33 位小数必须规格化 
和舍人成为27位。如果左移直到前导小数位为0,我们得到576 | 000000000 | 20,但这会舍入成 
不合法的值576|000000000;我们已经过分规格化了，因为正确答案是575 | 400000000。另一方 
面，如果（在某个其它的问题中）我们以值572 | 740000000 | 05开始，而且在过分规格化之前停止， 
就会得到575 | 400000000 | 50，它舍入到非规格化的数575 | 400000001;随后的规格化得出576 
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000000002,而正确的答案为576 | 000000001 o 

给出一个在这样的机器上解决这个矛盾的简单而又正确的舍入规则（不拋弃2的补码记号）。 
19. [24] 就数据的有关特征来说，程序 A 中的 FADD 指令的运行时间是多少？对于不引起指 
数上溢或下溢的所有输入而言，极大运行时间是多少？ 


Round numbers are always false. 


舍入的数总是不真实的。 

- SAMUEL JOHNSON (1750) 


I shall speak in round numbers, not absolutely accurate f 
yet not so wide from truth as to vary the result materially. 

我将在演讲中使用舍入的数，它们不是绝对精确的, 
但也没有远离真实到如此的地步，以致会显著地改变结果。 

- THOMAS JEFFERSON (1824) 


4.2.2 浮点算术的精确度 

就本质说来，浮点算术是不精确的，而且程序员们很容易就会滥用它，从而使计 
算的答案几乎全由“噪声”所组成。数值分析的主要问题之一，是确定某个数值方法 
的结果的精确度如何。这里有“信用差距”的问题 ：即我 们不知道计算机的答案有多 
少是可信赖的。计算机的新用户无保留地信任计算机，把它当做不出错的 权威； 他 
们倾向于相信打印出的答案的所有数字都是有意义的。醒悟了的计算机用户恰持 
相反的态度，他们经常怕他们的答案几乎是无意义的。许多认真的数学家曾试图对 

于浮点操作的序列给岀严格的分析，结果发现这个任务实在大得惊人，只好做些含 
糊其词的论证来聊以自慰。 

当然，对于误差分析技术的彻底考察，超岀了本书的范围，但我们将在这一小节 
中研究浮点技术的误差的某些特征。我们的目标是来发现应以什么样一种方式实 
施浮点算术，使得误差传播的合理分析尽可能简便。 

表达浮点算术运算特性的一个粗糙的（但相当有用的）方式，可以以“有效位”或 
相对误差的概念为基础。如果我们用近似值 f (1 十 <) 来表示在一台计算机内的 
一个精确实数: c ， 则量 ( = (x ~ x ) lx 称为该近似值的相对误差。粗略地说，浮点乘 
法和除法的运算并不使相对误差扩大 很多； 但近于相等的量的减法（以及浮点相加 
1/ ㊉ L 其中“近似地等于 - tO 则可大大增加其相对误差。所以我们有—个一般的 
经验法则，即从这样的加法和减法中，而不是从乘法和除法中去寻找主要的精度损 
失。另一方面，这一情况有点不合常人的想法，它需要适当地加以理解，因为“坏”的 
加法和减法是以完全的精度被执行的（见习题25)。 

浮点加法可能的不可靠性的后果之一，是破坏了结 合律： 

(W ㊉ T；) ㊉ ㊉㊉ tf )， 对许多 (1) 

例如 


(11111113 • ㊉ - 11111111 •) ㊉ 7‘5111111 =2. 0000000 ㊉ 7 .5111111 = 9.5111111 
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11111113 •㊉ （—11111111 .㊉ 7.5111111) 二 11111113 .㊉— 11111103. = 10,000000 

(这节中的所有例子都是以8位浮点十进算术给 出的； 而且以明显的小数点位置来 
指出指数。回忆一下，如同在 4.2.1 小节那样，符号 ㊉ ， ㊀ ， ®，( Z ) 是用来代表浮点运 
算的，它们对应于精确运算+，-， x ，/。） 

就破坏结合律这一点来说，在这一章开头岀现的 La Touche 夫人的评论对于浮 
点算术很有意义。像 “ ai + a2 + fl 3 ”或 “ St #, ”这样的数学记号本来就是以结合律 

的假定为基础的，所以一个程序员必须特别小心，不得暗中假定结合律的正确性。 


A.— 个公理化的方法 尽管结合律不是正确的，但交换律 

w ㊉ I ； = I；㊉ w (2) 

是成立的，而且这一定律对于程序设计和程序分析来说，在概念上不失为一种有价 
值的财富。等式 (2) 提示，我们应寻找一些为 ㊉ ， ㊀ ，®和所满足的重要 定律； 而且， 
我们认为，应该把浮点程序设计成为使尽可能多的通常数学定律保持有效，&才是 
合理的。如果有更多的公理成立，则就更容易写出好的程序来，而且程序也就变得 
更能从一台机器移植到另一台机器上去。 

因此现在让我们考虑某些其它的基本定律，它们对于前一节所述的规格化的浮 
点运算是正确的。首先我们有 


u Q) v — u ©— v (3) 

— ( w © i ;) = — u v (4) 

w ㊉ i ； = 0 当且仅当 v — — u (5) 

w ㊉ 0=w (6) 

从这些定律我们可以导出进一步的恒 等式； 例如（习题 1) 

u Q v = — (vQu) ( 7 ) 

恒等式 (2) 到 （6) 容易从 4.2.1 小节的算法导出，下列规则稍微不大 显然： 

如果 u ^ v 贝 !j w ㊉ ㊉ w (8) 

我们可以不通过分析算法 4.2.1 A 来证明这个规则，而是回过头去看奠定该算法的 
设计原理（算法的证明并不总比数学的证明更容易些），我们的思想是浮点运算应满 
足 


u ® v = round ( u + v) ^ u ㊀ v = round ( u — v) 

u ® v = round (u X v ) ， u & v = round (u/v) 

如同在算法 4.2. IN 中定义的， roundU ) 代表： c 的最好的浮点近似。我们有 


(9) 


round (- jo ) = — round () 

工 < ：y 蕴涵 round ( x ) ^ round (^) 

而且这些基本的关系直接推出性质 (2) 到（8)。我们也可以写出更多的恒 等式: 


( 10 ) 

( 11 ) 


u ® V ~ V ® U ， ( - u) ® V = — (u ® v) , 1 (X) ^ = V 

当且仅当 w =0 或 p =0 


(— u) (Z) v = u 0(— v) = — (u (Z) v) 

0 0 T ； = 0 , w 0 1 = u , u Q) u ~ 1 
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如果 U<V 和 W 〉0 ， 则 u ® zv ^： v ® IV ，且 u ( Z ) 0 zt >; 当 时 ， W 0 U 

Q ) v 。如果 w ㊉ t ； = w + * r ；， jil ! j ( w © t ；)(3 i = w ; 且如果 u 0 v = w x 贝 lj ( w ® 

V) ⑦ v = u 。 我们看到，如果定义下得适当，则尽管浮点运算是不精确的，仍有大量 
规则存在。 

当然，若干熟悉的代数规则仍然显然地不存在于上边的恒等式集 合中； 如习题 
3中所示，浮点乘法的结合律不是严格正确的。而且稍微更糟的是 ® 和 ㊉ 之间的分 
配律不成立。设 W =20000.000，！；= -6.0000000 以及加二 6. 0000003;则 

U 0 iO ㊉ U 0 zt ；) = - 120000.00© 120000.01 = .010000000 

w®(t ； ㊉ 加） = 20000 . 000 ®. 00000030000000 =• 0060000000 

所以 

2 /③ （U ㊉ (12) 

另一方面，当6是浮点进制时，我们有 b ®( v ® w ) = ( b ® v )®( ， 因为 

round ( bx ) = b round ( ) (13) 

(严格地说，我们在这一节里考虑的恒等式和不等式隐含地假定指数的下溢和上溢 
不出现。当 M 太小或太大时函数 r 0 und (: r ) 是无定义的，而且像 （13) 这样的等式仅 
当两边有定义时才成立。） 

浮点算术使传统代数被破坏的另一个重要例子是柯西基本不等式 

(4 + …+ x 2 n ){y\ + •** + W) > + ■** + oc n y n ) 2 

出问题。习题7表明，甚至在72 =2，:^ =工 2 = 1的简单情况下，它也不成立。使用 
教科书上的公式 




n 



工 1 k 



2 


工 k 


n ( n — 1 ) 


1 < 走 < ” 




(14) 


来计算某些观察的标准差的新程序员经常发现他们取的是一个负数的平方根！用 


浮点算术来计算均值和标准差的好得多的方式是使用递推式 


Mi = jo I } M k = M k -i ㊉ （ ； ㊀ M k - X ) 0 k (15) 

Si = 0 ， S k = Sh ㊉ （ : c 々 ㊀ M k - X ) ® (oc k Q M k ) (16) 


其中 2( k ‘ n ，。 二 -1) [参考 B . P . Welford , Technometrics 4 (1962),419 

〜 420]。 由这个公式可知， Sm 绝不能是负的，而且如习题16中所证明的那样，我们 

可以避免通常的累计求和方法遇到的其它严重问题(关于能更好保证精度的一个求 
和技术，见习题19)。 

尽管代数法则不一定都成立，但我们通常可以证明它们也不是太离谱的。当 

b e ~ l ^ x < b e 时，我们有 round ( a :) = x + p(x ) ，其中 I p ( x )\ < + 々，因 此 

round ( x ) — x{ \ + 8( jo)) (17) 

其中相对误差有与 x 无关的界： 
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我们可以使用这个不等式来简单地估计规格化浮点计算中的相对误差，因为 u®v 

-(U + lO(l + ) ，等等。 

作为典型的误差估计过程的一个例子，我们考虑乘法的结合律。习题3表明 
U z 般不等于“@(1；0加），但是这里的形势比加法的结合律 （1) 和分配律 

(12) 面临的形势要好得多。事实上，假定不出现指数下溢或上溢，对于某些心，心， 


我们有 


(U ® v) ® W = (( uv)(l + VO — uvw{\ + (^! ) ( 1 + S 2 ) 


U ® ( V ® zv) = U ® (( VVU )(1 + (^3 ) ) = uvw(l + 《 3)(1 + 心 ) 


其中对于每一个 J 。 因此 


其中 


( U ® v ) ® ZV _ (1 + 汐 1 )(1 + 汐 2) 

U ® (v ® U)) (1 + 々 3)(1 + 汐 4 ) 


I ^ I < 2b"l(l - y6 1_/> ) 2 (19) 

在这种分析中，数出现得如此频繁，因而对它已经起了一个特殊名字，叫 
一个 ulp ， 意思是在分数部分的“最后位置中的一个单位”。浮点运算正确到半个 dp 
以内，而且用两个浮点乘法计算 卿 将正确到大约一个 uip 之内（忽略二次项），因 
此乘法的结合律在大约两个 ulp 的相对误差之内成立。 

我们已经证明近似地等于②加），除非发生指数上溢或下溢。 
值得更详细地研究近似相等的直观概念，我们能以一个合理的方式更精确地给出这 
样的陈述吗？ 

使用浮点算术的程序员几乎总不希望测试是否两个被计算的值彼此完全相等 
(或至少他几乎不需要尝试这样做），因为这是极不可能出现的事。例如，在使用一 
个递推式 

: + 1 = f(x n ) 

时，如果因为某一教科书的理论指出，当 〜时， A 趋于一个极限，你就去等候使 
得 x ， ; + i = : r ,, 的^出现，这通常是一个错误。因为由于中间结果的舍入，序列&可 
能是周期的且周期较长。正确的方法是，对于某个适当选定的数夂等候到 I % + 1 _ 

I <夂但因为我们并不需要预先知道量 A 的阶，等候到 

I x n + [ - X J f | (20) 

甚至更好。现在$是一个更易于选定的数。关系 （20) 是叙述& + 1 和&近似相等 
的另一个方式，而且我们的讨论表明，当涉及浮点计算时，如果我们仅能定义一个适 
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当的近似关系，则一个“近似相等”的关系将比传统的相等关系更加有用。 

换句话说，浮点值的严格相等不那么重要，这一事实意味着我们应当有一个新 
的运算 ，即浮点比较 ，其目的在于帮助评价两个浮点量的相对值。对于进制 I 余 q 


的浮点数 w = (^ ，/ w )和 v 二 U v ， f v ) ，下列定义似乎是适 当的： 

U -\ v (^) 当且仅当 v - U > ( max ( b e -~ q H (21) 

u — v (() 当且仅当 I w w I < 6 max (6 〜 '/A — g ) (22) 

u )— v (() 当且仅当 u ~ v > ( max ( b e ’ q ， b e -’ q ) (23) 

u ^ v ( e ) 当且仅当 I - w I < — min (6' — 9 (24) 


这些定义既可应用于规格化的值，也可应用于非规格化的值。注意，对于给定的任 
何一对值 w 和 D ， 必定恰有条件 u H d (确定地小于），“〜 W 近似地等于）或 u)-v 
(确定地大于）之一成立。关系比 W 〜 V 稍微更强些，它可以读作 w 实质上等 
于1”。所有这些关系都是借助于一个正实数 e 给出的，这个 f 表示所考虑的近似程 

度。 

观察上述定义的一个方法是把每个浮点数“同一个“邻域”集合 N ( u ) = 
j x I \x - u \ — 叫结合 起来；于是， iV ( w ) 表 7 K 按照 w 的浮点表不的指数计算接 

近于 W 的一个值集。在这些术语之下，我们有 “ Hz ; 当且仅当 N (“）< t ； 及 “<iV 

( v ); u-v 当且仅当 / VU ) 或 N ( u ); u)-v 当且仅当 w > 及 N ( u )> 

v ; u ^ v 当且仅当 wGiV ( t ;) 和 veN ( u)o (这里假定，测定近似程度的参数 （ 是一 


个常数；一个更完备的记号将指出 N ( u ) 对 f 的依赖性。） 

下边是上述定义的一些简单推论： 

如果 u ^ v (0 贝 1 J vY ~ u (() (25) 

如果 w 〜 t ; ( f ) 贝 1 J u 〜 v (() (26) 

u^u ( ^ ) ; (27) 

如果 (0 贝 ij u<v (28) 

如果 udt ； ( q ) 且 则 i/Hr G 2 ) (29) 

如果 w 〜 r (^)且 贝 1 Jw 〜。 G 2 ) (30) 

如果 GO 且 ^<^2 则 G 2 ) (31) 

如果 w H r ( e { ) 且 v ^ tju ( f 2 ) 则 w 彐功 ( minCe !,^)) (32) 

如果 w 〜 z ; ( q ) 且 v^vu (( 2 ) 贝 U “ 〜 w (q + 4) (33) 


而且，我们可以毫无困难地证明 


U — V《 （u 

且 

U — V ( V 

意味着 

U ^ V ( f ) 

(34) 

U - V ^ ( u 

或 

U — V ^ f V 

意味着 

U 〜 V ( 6 ) 

(35) 


反过来，当^<1时，对于规格化的浮点数 w 和 I 


u ^ v G ) 意味着 | w _ 

-v 《 u 

且 

u — v ^ b ( v 

(36) 

u — v G ) 意味着 I u - 

—v ^ b ( u 

或 

u — v < v 

(37) 


假设 M = 6 1 — ^是一个 ulp 。（17) 的推导建立了不等式 l：r _ round ( x ) 
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X 


〈言 q min( 


X 



r 


ound( 


X 


，因此 


x ^ round( x ) 


2 


e o 


(38) 


由此得出 ， w ㊉ w 〜 +1； (^^ 0 )，等等。上边导出的乘法的近似结合律也可以由下 

列推算得 到：由 （19)，我们有 


' -^ | U 0 (v ® UU) I 

(1-如。） 

把② w 和 W ③互换，同样的不等式成立。因此由（34)，当 

/ 1 \ 2 

2^ o / 1- 时， 

/ \ z / 

U)® U®(v® ZV) ( 39 ) 

例如，如果6 = 10, p = 8,我们可以取 d 00000021。 

在数值算法中，关系 H ，〜，卜和〜是有用的，因此提供浮点数算术运算以及对 
它们进行比较的一些子程序是一个好主意。 

现在我们把注意力转回到寻求浮点运算所满足 的精确 关系的问题。有趣的是 
从一种合理观点来看，浮点加法和减法并不是完全无法对 付的； 因为它们都满足下 
列一些定理所述的并非一目了然的恒等式。 

定理 A 设 U 和 V 是规格化的浮点数。假定不出现指数上溢和下溢，则 

((w ㊉ I；)㊀ “）+ ((w ㊉ tO ㊀ （（“ ㊉ r) ㊀ w)) = w ㊉ w (40) 

这个看上去稍微麻烦的恒等式，可以改写为如下较简单的形式，设 


u = ( u ® v) Q v , 

U" = (u® v) G V y 


V 


V 


u ® v) Q u 

U ® V) ㊀ u’ 


直观上， z / 和 z / 应该近似于 W ，而/和沪应该近似于 


定理 A 告诉我们 


W ㊉ 


/ 


V 


U 



V 


U 



V 


这是比起恒等式 


W ㊉I ； 

更强的命题，后者由舍入 (42) 得到 


/ 


U 


㊉ t ; 


U 


㊉7 / 


o 


证明 


如果 


(41) 

(42) 

(43) 


t = x (modulo b e ) , U I < (44) 

则我们说〖是: c 的一'个模 V 尾部。于是 x - round ( x ) 总是： c 的一'个尾部。.定理 A 
的证明大部分依赖于在习题11中证明的以下简单事实。 

引理 T 如果 t 是浮点数 x 的一个尾部，则 ㊀ Z Z 。 ■ 

设 W = “ ㊉ 〜当 w =0 时，定理 A 显然成立。通过以6的适当次幂来乘所有变 


• 212 • 


4.2 浮点算术 


量，我们可以不失一般性地假定 Q = 于是 z / + t ；= m + r ， 其中厂是“ + 1；的一 

A 

个模 1 尾部。而且“ / = round (vu ~ v ) 二 round (w — 厂） 二 其中 t 是 u _ 

r 的一个模 Y 尾部，而且 e = e t / — p 。 

如果 e <0，则 t = u~r— — v {modulo 6 e )， 因此〖是 - w 的 一 ^个尾部且 t / / = 
round ( w - u') = round ( v + t) = v t\ 这就证明了 （ 40 ) 。 如果 e 〉0，贝 1 J | w - r | ^ 

而且由于 | ■，我们有 I w \ ^ b p ^ \ o 由此得出 w 是一个整数，所以 r 

是 T ； 的一个模1尾部。如果/ =心则〖= - r 是 - W 的一个尾部。否则关系 
round ( 意味着 | = b p ~ 1, \ r\ = | w ' | = b p , t = r \ 再次 t 是 — r 的一 

个尾部。 ■ 

定理 A 揭示了浮点加法的一个规律性，但它似乎不是一个特别有用的结果。下 
面的恒等式是更有意义的。 

定理 B 在定理 A 和 （41) 的假设之下, 

w + i ； = (w ㊉ t ；) + ((w ㊀ z /) ㊉ （ I；㊀ I ；")) (45) 

证明事实上，我们可以证明， u ㊀ u , = u - u ' , vQv "二 V — i /’ ，而且 （W - / ) ㊉ 
(V - vl = (u- /) + (!；-/)， 因此从定理 A 可得出（45)。利用前边证明中使用 
的记号，这些关系分别等价于 

round ( t + r ) = t + r , round ( t ) 二 t , round ( r ) = r (46) 

习题 12 在的特殊情况下证明了定理。否则^ + t ； 至多有个有效 
位，而且容易看出: round ( r ) = r 。 现在如果 e >0, 则定理 A 的证明表明 r = _ r 或 

t — r - ±|。如果我们有 t + r=u 和 (modulo b e ) ;这足以证明，假定 

和则〖+ r 和 Z 舍入成它们本身。但~<0或~<0将同我们关于 
〜 - 的假设矛盾，因为〜= 6。 ■ 

定理 B 给岀了 M + T ； 与^ ㊉ !；之 间差的 一个显 式公式 ，并用浮点算术的五个运 
算可以直接算出的量来表达它。如果进制6是2或3,我们可以对这个结果进行改 
进，并只需用两个浮点运算和一个绝对值的（定点）比较即可给出修正项的精确值。 

定理 c 如果 b <3 和 M > M，M 

W + T ； = (W ㊉ T ；) + (W ㊀ （W ㊉ 1 ；)) ㊉ I ； (47) 

证明 仍旧沿用上边证明的 约定， 我们希望证明 = 但只须证明 t / = 
vo — u 即可，因为利用 （46) 将得出 vQ v ' — round ( v — v ') = round ( a + v — zv )— 
round ( r ) = r 0 

事实上，我们将证明每当和 e ) e v 时， （47) 成立。如果，则 r 是 u 

的一个模1尾部，因此，如所希望的那样， t / zjoQ u vQ r v — r zsu ~ u 0 如果 
G < p ，则我们必然有 b = p - l ， 而且 uu - u 是 6 _1 的一个倍数；因此如果它的量少 
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于 6 — 1 ，则它将会舍入为它本身。由于6<3,我们确实有 | 功 - w | < | u ； - w 
- ^ I + + — ! )〈沪 _1 十、这就完成了证明。 ■ 

定理 A ， B 和 C 的证明在： r 恰处于两个浮点数中间时的歧义情况下并不真正地 
依赖于 nxmd (：0 的精确 定义； 解决歧义性的任何方法都足以保证我们至今已经证 
明的每件事情的正确性。 

没有一种舍入规则对每种应用来说都是最好的。例如，当计算收入税时，我们 
一 般地需要一个特殊的规则。但是对于大多数数值计算来说，最好的办法乃是在算 
法 4.2.1 N 中所确定的舍入方案，该方案认为，当舍入的是一个歧义值时，最低有效 
数字应弄成总是偶数（或总是奇数）。这不是只有吹毛求疵的人才感兴趣的雕虫小 
技，它是一个重要的实际考虑。因为歧义的情况发生得惊人地频繁，而且一种有偏 
倚的舍入规则产生相当低劣的结果。例如，考虑十进算术并假定5的余数总是往上 
舍入，则如果 u = l . 0000000 ^ r = 0.55555555,我们有 u ㊉ v = 1 . 5555556;如果我 

们用浮点减法从这个结果中减去 t 我们得到 z / = 1.0000001。从/加 r 和减 t ； 给 
出1.0000002,下次我们得到 1.0000003, 等等； 尽管我们总在加和减相同的值，但这 
一结果保持增长。 

这个现象称做漂移，如果使用基于最低有效数字的奇偶性的稳定的舍入规则， 
它就不会出现，更精确 地说： 

定理 D ((( w ㊉ ⑦ ） ㊀ ) ㊉⑦）㊀ r = ( “ ㊉ p 。 

例如，如果 w = 1.2345679 和 w = - 0 . 23456785，我们求得 

Z/ ㊉ v = 1 ‘ 0000000， （w ㊉ 幻 ）㊀ = 2345678， 

(“ ㊉ 幻）0幻） ㊉ 幻）二0.9999995， （（ U ㊉ W ㊀ 幻） ㊉ = 1.2345678 

对于一般的〃和 d 的证明似乎要求比在上述一些定理中更为详细的情况 分析； 见下 
面的文献。 ■ 

定理 D 对于“舍入到偶数”和“舍入到奇数”两者都是正确 的； 在这两种可能性之 
间我们应当如何选择呢？当进制纟为奇数时，除了在进行浮点除法的期间外，绝不 
会出现歧义的情况，而在这种情况下舍入相对地不大重要。对于偶的进制，有理由 
优先釆用下列规则 ：“当 6/2为奇数时舍入到偶数，当6/2为偶数时舍入到奇数 。”一 
个浮点小数的最低有效数字经常成为在随后的计算中要舍去的余数，而这个规则只 
要可能就避免在最低有效位生成数字6/2;它的效果是提供对于歧义舍入的某些信 
息，使得随后的舍入将趋于非歧义的。例如，如果我们在十进系统中舍入成奇数，则 
对 2.44445 重复进行舍入的结果是每舍入一次就少去一位，而导致了序列2.4445, 
2. 445，2.45，2.5，3;如果舍入成偶数就不会出现这种情况，尽管重复舍入像 2.5454 
这样一个数将导致许多错误。[见 Roy A . KeirJnL Proc. Letters 3 (1975)，188 〜 
18 L ] 另一方面，有些人喜欢在所有情况下都舍入成偶数，使得最低有效数字为 0 的 
可能性更大。习题23说明了舍入成偶数的这一优点。没有一种选择是确定地优于 
另一 种的； 幸而进制通常是 b =2 或 b =10, 这时每一个人都同意舍入成偶数是最好 
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如果读者检验一下上述几个证明的一些细节，将不难发现由简单规则 从如 二 
mimdU + I ；)带来的大量简化。要是我们的浮点加法子程序没能给出这一结果，即 

便只是在某些少数情况下，这些证明将变得更加复杂化，或许它们将完全失败。 

如果用截取运算代替舍入，即若令 uQv 二 trunc (^ + w ) 和 uOv 二 trimcU _ 

r ) ，其中 tmnc ( x ) 把所有正实数 x 变成为不大于 x 的最大浮点数，则定理 B 不成 
立。当“ ^和 u ® v 之间的差不能精确地表达为一个浮点数时，则定理 B 对于像 

(20, + . 10000001) ㊉ （10, - .10000001) = (20, + . 10000000) 这样一些情况将出现 
例外； 如果这个差能表达为浮点数，则对于像12345678 ㊉ .012345678 这样的情况也 

要出现例外。 

许多人觉得，由于浮点算术从本质上说就是不精确的，因此在一些个别的情况 
下使得它仅仅稍不精确也无妨，假如这样做方便的话。这种策略在设计计算机硬件 
中能节省些钱，或者节约一个子程序的少量的平均运行时间。但是上边的讨论表明 
这样一种策略是错误的。如果在一些情况下任意采用不正确的舍入，我们可能节省 
FADD 子程序，即程序 4.2.1 A 的5%的运行时间，以及节省它25%的空间，但是还是 
不要这样做为好。原因并不在于崇尚对位数的追求； 一 个更基本的论点在这里是至 
关紧要的：只要可能，数值子程序提供的结果应当满足那些简单的、有用的数学法 
则。 关键性的公式 w ㊉I ； = round ( w + tO 是 一 个“规律性”的性质，它告诉我们，计算 
算法的数学分析做还是不做，其差别是很大的。如果没有任何基本的对称性质，则 
证明有趣的结果的工作就变成为极端无聊的。 人们对于工具的欣赏乃是取得工作 

成功的一个必不可少的成分。 

B . 非规格化的浮点算术 对所有浮点数进行规格化的方针可以以两种方法来 
解释。从有利方面看，是试图得到在一给定精度范围内所能达到的极大精确性，但 
是我们也可以把它当成潜在危险，因为它给出的结果的精确度比实际上应有的精度 
更加 精确。当把 （ I + . 31428571 )0(1，+. 31415927 ) 的结果规格化为 
(-2, + .12644000) 时，我们把结果量不精确性可能更大的信息抑制了。而如果答 
案保留为（1，十 .00012644) 的话，则这样的信息就保留下来了。 

一个问题的输入数据，经常并不如浮点表示所允许的那样精确，例如，阿伏加德 

罗常数和普朗克常数的值，我们仅知道8位有效数字，如果用 

(27 ， + ‘ 00060221 ) 和 (- 23 ， + ‘ 00066261) 

而不是通过(24, + . 60221400) 和（ - 26, + . 66261000) 来表示它们，可能更为适当。 
如果对每个问题都以一种非规格化的形式给出我们的输入数据，并指明假定的精度 
是多少，而且输出时也指明在答案中的精度是多少，那就太好了。可惜这是一个非 
常困难的问题，尽管使用非规格化的算术能提供某些信息。例如，我们可以相当肯 
定地说，阿伏加德罗常数与普朗克常数的积是（1， + • 00039903 ) ,和是 
(27, + .00060221)。（这个例子的目的并不是想说明这些基本常数的和与积有任何 
重要的物理 意义； 要点在于，当原始的操作数彼此无关时，就有可能在对于不精确量 
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进行计算的结果中，保留关于精度的一点信 息。） 

有关非规格化算术的规则简单地说是：设4是〃= ( A ) 的小数部分中前导 

0的个数，因此匕是在小于等于 p 的条件下使 l/J 的最大整数。于是加法和 

减法恰如在算法 4.2.1 A 中那样实施，但是去掉了所有左调。乘法和除法如同在算 
法 4.2.1 M 中那样实施，但是要右调或左调答案，使得恰好出现 ma X ( Z w ， U 个前导 

0。实际上，这个规则在手工计算中已经使用了好多年。 

由此得出，对于非规格化的计算 

e u ® v， e u Qv 二 max ( e u , e v ) + (0 或 1) (48) 

e u(E)v = e u + e v - q ~ mm ( l u , l v ) - (0 或 1) (49) 

e u Q v = e u ~ e v + q - l u + l v + max (/ w ,/,；) + (0 或 1) (50) 

当一个计算的结果为 0 时，即以一个非规格化的 0( 通常称为“量0的阶”）作为答案 
给出； 这表示答案可能不真正为0,我们只是不知道它的任何有效数字。 

误差分析有着和非规格化浮点算术稍微不同的形式，我们定义 

= 七 b 、- 。 ” 如果 U = ( e u J u ) (51) 

这个量依赖于^的表示，而不仅仅依赖于值 b e Jf u 。 舍入规则告诉我们 

Iw ㊉ + ^u®v y |w ㊀ 幻 一 (W — t；)|< 

\u Q) V - (ulv) \ ^ S 

u (dv 

这些不等式既适用于规格化算术，也适用于非规格化 算术； 两种类型的误差分析之 
间的主要差别在于每个运算（等式 (48) 至 （50)) 的结果的指数之定义。 

我们已经阐述本节早些时候定义的关系 H ，〜，卜以及〜，既对规格化数有效和 
有意义，对非规格化数也亦然。作为使用这些关系的一个例子，我们来证明类似于 
(39) 的对于非规格化加法的一个近似结合 律：对 适当的^ 

( w ㊉ 幻） ㊉㊉ （ r ㊉ (52) 

我们有 

|(W ㊉ 幻 )㊉ (W + P+W) < (W ㊉ 幻 )㊉ ㊉ tO + ⑽)+ 

W ㊉ W-(W + T ；) ^ 汐 （ w ㊉ 4 ㊉ to + ^ u®v ^ 


2 S 


(W ㊉ tO ㊉ 


对于 | w ㊉ （ D ㊉ 1^) _ (&十 < ^+ < ^)1类似的公式成立。现在，由 


^ )®to 


max ( e u y e v 


W 



(0，1 或 2)， 我们有占（暴) ㊉ ⑴ < 办 2 匕 ㊉ u ㊉ 十因此我们发现， 


当时 （52) 成立； 相对于结合律，非规格化加法不像规格化加法那样不 
规律。 

应当强调的是，非规格化算术绝不是万灵药。有若干例子，它给出比现有精确 
度更高的精确度（例如，大量具有大致相同绝对值的量的加法，或者对于很大的 n ， 
计算 /); 但却有更多的例子，表明它有很差的精确度，而规格化算术却确定能产生 
相当好的结果。为什么“每次一个操作”的直接误差分析方法没有一个是令人满意 
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的？ 一 个重要的原因就是操作数通常都不是彼此无关的，这意味着误差趋向于以非 
寻常的方式彼此抵消或者加强。例如，假设: r 近似于1/2,并有其近似值 y = x + 8, 
S 为绝对误差。如果现在希望计算 2 ( 1 - I )，则我们可以形成^( 1 - 30 ; 如果^ = 

y + < ， 则我们发现 y ( l ~ y ) = x ( l ~ x ) -2(8 - ， 这时误差的绝对值已经减少相当 

多：它 已经乘以因子十3。这仅仅是当操作数不是彼此独立时，不精确量的乘法 
可以导致一个十分精确结果的一种情况。一个更明显的例子是： T 02 的计算，它可 
以以完全的精确度求得，而不管我们开始时从多么坏的工的近似值着手。 

非规格化算术给予我们的额外信息，通常可能比在进行一项持久的计算时被它 

破坏的彳目息更为重要，但是（和通常 一 样），使用时务必小心谨慎。 R . L . Ashenhurst 

和 N . Metropolis 在 Computer and Computing f AMM , Slaught Memorial Papers 10 

(1965 年 2 月 )，47 〜 59 ; N . Metropolis 在 N timer ‘ Math . 1 (1965) ， 104 〜 112 以及 R . 
L . Ashenhurst 在 in Digital Computa tion 2 , L . B . Rail 编辑 （New York : Wiley , 

1965),3 〜 37 中讨论了适当地使用非规格化算术的一些例子。 R . L . Ashenhurst 在 
JACM 11(1964),168 〜 187中给出了对于非规格化形式的输入和输岀计算标准数 
学函数的适当方法。 N . Metropolis 在 J £ E £： Trans . C ~22 ( 1973)，573〜576中讨论了 
非规格化算术的一个扩充，它能记住某些已知是精确的值。 

C •区间算术 对于误差决定问题的另一个方法是所谓的“区间”或“范围”算术， 
在此算术之下，在进行计算期间要保持每个数的上界和下界。于是，例如，如果知道 

和，我们以区间记号 u = [ u Qy u x ] yV =[ v () , ] 来表示它们。 

和 K ㊉ P 为 Ug ▽ 叫 ， ZM A w ]， 其中▽表示“低浮点加法”，即小于或等于真正的和 

的最大可表示数，而 A 类似地定义（见习题4.2.1-13)。而且= [ Wo V t ；!， 

U X A 叫];还有，如果 w 0 和 为正，我们有 u®v ^ [ u 0 W A v { ],u ( Z ) V = 

[ z/o ▽ v \、 u x lk %]。 例如，我们可以表示阿伏加德罗数和普朗克常数为 

N = [(24, +• 60221331)，（24, +.60221403)] 
h = [(- 26, + .66260715),( - 26, + .66260795)] 

它们的和与积为 

N ® h 二 [(24, + 60221331),(24, +.60221404)] 

N ® h = [(- 2, +. 39903084) ，（- 2, + . 39903181 )] 

当叫<0< %时，如果我们试图以[%，^]来除，则有除数为0的可能性。因为 

奠定区间算术的原理是提供严格的误差估计，在这种情况下应当标岀除以0的错 
误。然而，如果像在习题24中所讨论的那样引进特殊的约定，则在区间算术中上溢 
和下溢不必当做严重的错误。 

区间算术大约仅仅比通常的算术长两倍的样子，而且它提供真正可靠的误差估 
计。考虑到数学误差分析的困难，它确实是值得支付的小代价。像上边所说的那 
样，由于在一个计算中中间值通常是互相依赖的，故由区间算术所得到的最后估计 
势必将是悲 观的； 如果我们要处理区间算术，则通常要重新设计迭代数值方法。然 
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而，有效利用区间算术的前景看来非常好，因而应努力提高它的可利用性，并使它尽 
可能地成为对用户友好的。 

D . 历史和文献 Jules Tannery 关于十进计算的经典论述， Lecons d' - 
Arithmetique ( Paris ： Colin , 1894) 指出，如果头一个被抛弃的数字大于等于5，正数应 
该往上 舍人； 因为恰有一半的十进数字大于等于5。他觉得这个规则平均将向上舍 
入一半次数，所以它的误差将得到补偿。在歧义的情况下“舍人到偶数”的思想似乎 

首先是由 James B . Scarborough 在他的先驱性的作品 iVeumericai Mathematical Anal¬ 
ysis 的头 一 版 （ Baltimore : Johns Hopkins Press , 1930) ,2中提到的；在第2版 （1950) 中 
他进一步阐明了这个观点，指出任何有头脑的人都应该明 白：当 5被去掉时，仅在一 
半的情况下前一位数字应加1，因此他建议舍人成偶数以便达到这一点。 

对浮点算术的头一个分析是由 F . L . Bauer 和 K • Samelson 给出的， Zeitsc / ir/TY fiir 
angewandte Math, und Physik 4 (1953) ， 312 〜316。此后过了 5 年以上才有第二篇 
作品 出现: J . W . Carr III , CACM 2,5(1959 年 5 月)，10 〜 15。也见 P . C . Fischer , 
Proc. ACM Nat. Meeting 13 (1958) ，论文39。由 J . H . Wilkinson 著的 

rors in Algebraic Processes (Englewood Cliffs : Prentice - Hall ， 1963 ) ，说明 了怎样把个 

别算术运算的误差分析应用到大型问题上去。也见他在 Algebraic Eigenvalue 
Problem ( Oxford : Clarendon Press ，1965) 上的论文。 

有两篇重要的文章可以特别推荐来供进一步 研究： W . M . Kahan , Proc . IFIP 
Congress (1971)，2，1214 〜 1239 ; JEE £： 7>屬. C -22 (1973 )，601 〜607。这两篇论文 

都包括有用的理论并且指出这一理论能用于实践。 

这 一 小节中引进的关系 H ， 〜，卜，〜类似于由 A . van Wijngaarden 在 BIT 6 

(1966),66-81 中所发表的一些思想。上边的定理 A 和定理 B 受到 Ole M 0 Uer 的 
某些有关工作的启示，见 BIT 5 (1965),37 〜 50,251〜255;定理 C 是由 T . J.Dekker 
给出的， Numer . Math . 18 ( 1971 )，224〜242。 S . Linnainmaa 发表了关于这三个定理 
的推广和改进，见 BIT 14 (1974),167 〜202。 W . M . Kahan 在某些未发表的笔记中 
给出定理 D 。 关于完备的证明及进一步的评述，见 J . F . Reiser 和 D . E . Kmith ， Jn /. 
Proc. Letters 3 (1975 )，84 〜 87 ，164。 

非规格化的算术是由 F . L . Bauer 和 K . Samelson 在上边引证的论文中推荐的， 
而且它为： f . W.Qtrr III 于1953年在密执安大学单独使用过。若干年后 ， MANIAC 

III 计算机的设计中，将两种类型的算术都包括在了硬 件中； 见 R . L . Ashenhurst 和 
N . Metropolis , JACM 6 (1959), 415-428；/£ E £ Trans. EC -12 (1963),896-901; 

R . L . Ashen hurst y Proc . Spring Joint Computer Conf . 21 (1962) ， 195 〜 202。 早期关于 
非规格化算术进一步的讨论也见 H . L . Gray 和 C . Harrison , Jr . , Proc . Eastern Joint 
Computer Conf \ 16 (1959 )，244 〜 248 ， 以及 W . G . Wadey ， CM 7 (1960)，129 〜 

139。 

关于区间算术的早期发展，以及某些变型，见 A . GUDb，CACM 4(1961) ,319 〜 
320 ; B . A . Chartres , JACM 13 (1966 )，386 〜 403 ; 以及 Ramon E . Moore y Interval 
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Analysis ( Prentice - Hall ， 1966 )。 Moore 后来的书 ， Methods and Applications of Inter ¬ 
val Analysis ( SIAM ， 1979) 描述了关于这个课题后续的成果。 

20世纪80年代初在卡尔斯鲁赫 （ Karlsruhe ) 大学研制了对 Pascal 语言的一个扩 

充，它允许变量有“区间”类型。这个语言还包括了科学计算的许多其它特征。关于 

该语言的描述，请见 Bohlender , Ullrich , Wolff von Gudenberg 及 Rail y Pascal~SC ( Aca ¬ 
demic Press , 1987) 0 

Ulrich Kulisch ^fGrundlagen des numerischen Rechnens ： Mathematische 

Begrilndung der Rechnerarithmetik ( Mannheim : Bibl . Inst . ， 1976) 完全致力于浮点算 
术系统的研究。也可见 Kulisch 在 ffiEE TVans . C-26 (1977) ，610〜621上的一篇论 

文，以及他最近和 W . L . Miranker 写的书 Compufer Arithmetic in Theory and Practice 
(New York ： Academic Press , 1981) 0 

关于浮点误差分析最新工作的杰出概述，请见 N . J . Higham , Accuracy and Sta ¬ 
bility of Nemerical Algorithms ( Philadelphia ： SIAM , 1996) 。 


习 



注： 以下习题除有相反的说明外，都假定采取规格化的浮点算术。 

1 . [ M 18] 证明恒等式 （7) 是 (2) 到 （6) 的一个推论。 

2. [ M 20] 利用恒等式 （2) 到 （8) 证明，当和 y >0 时 ，“ ㊉ x ) ㊉ （i ㊉ y 。 

3. [ M 20] 找出8位数字的浮点十进数和 w ， 使得 

It ® (v ® Vj) ^ (M® v) ® W 

且在这些计算中，无指数上溢和下溢出现。 

4. [ J 0] 是否可能有浮点数和加，对于它们，在进行的计算中有指数上溢出 
现，但在进行的计算中则不出现。 

5. [ M 20] 如果不出现指数上溢和下溢，对于所有的浮点数 w 和^尹 0 ，u 0 I ；)是 

否一个恒等式？ 

6. [ M 22] 对于所有浮点数 w 来说，下列两个恒等式是否成立？ （ a ) 0 ㊀ （0© w ) = 

(b) 1 0(10 u) = u 0 

7. [Ad] 令 w ②代表求浮点二进数 u 和 r 使得 （ i / ㊉ I ；) ② >2( w ② ㊉ i ； ②）。 

► 8. [20] 设 e = 0.0001; 对于下列的进制10,余0,8位数字浮点数的数对，关系式 w d D 0)， 
U — V (() y uV~V G ) ， 中哪几个成立？ 

a) u = (l，+ .31415927),^ = (1,+ .31416000)； 

b) w = (0，+ .99997000) ，。= (1，十 .10000039)； 

c ) u = (24, + .60221400)，r = (27, 十 .00060221)； 

d ) u = (24, + .60221400)，z； = (31，+ .00000006); 

e) u = (24, + . 60221400) ， z; 二 （28 ， 十 ， 00000000) 0 

9.[ M 22] 证明 （33) 并说明为什么这个结论不能被加强成为 多议 ( m + . 2 )? 

► lO.[M25](W.M.Kahan) 某台计算机实施浮点算术，而无适当的舍入，而且事实上它的浮点 
乘法程序忽略了 2/) 位数字的乘积/丄中除> 位最高位外的所有位（于是，当 fj v < llb 时， 

的最低位数字由于随后进行的规格化而总是成为0)。证明这将导致乘法单调性的 破坏； 换言之， 
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疋出正的规格化浮点数“，使得在这台机器上有但② If 。 

U.[M20] 证明引理 T 。 

12. [M24] 当 | 匕-〜时，给出定理 B 和 （46) 的证明。 

► 13.[ M 25] 某些程序设计语言（甚至某些计算机）仅仅利用浮点算术，而没有提供整数的精确 

计算的设备。如果希望有对整数的操作，我们当然可以把一个整数表示为一个浮 点数； 而且当浮 

点操作满足 （9) 中的基本定义时，我们知道，假定操作数和答案都恰能以 p 位有效数字精确表示， 

则所有浮点运算都将是精确的。因此只要知道数不太大，我们就能进行整数的加、减或乘，而没有 
舍人误差引起的不精确性。 

但假设一个程序员想要确定，当 m 和《关0都是整数时，777是否 n 的一个整倍数。并迸一步 
假设，如同在习题 4.2.1-15 中那样，有一个子程序，对于任何给定的浮点数《，可以用它来计算量 

roundmod 1 ) = t /. Cm ^ d > l c 确定 m 是否”的倍数的一个好方法是利用假定的子程序，测试是 

否 （m 0 1=0;但是或许在某些情况下，浮点计算中的舍人误差将使这个测试无效。 

试寻找关于整数值《关0和 m 的范围的适当条件，使得 m 是 n 的倍数的充分必要条件是 

( m 0 n ) Cmog ) 1=0。换句话说，证明如果 m 和/?不太大，则这个测试是正确的。 

14. [ M 27] 当使用非规格化的乘法时，试找出一个适当的 e 使得 

(Oo (这推广了（39)，因为当输入操作数和 w 都已规格化时，非规格化乘法恰和规格化乘法 
相同。） 

► 15. [ M 24 ]( H . Bjork ) 如果计算出一个区间的中点，它是否总处于两个端点之间？（换言之 ， w 
是否意味着 ㊉ 2^1；?) 

16. [M28] ( a ) 若 n 二10 6 且对于所有^％二1 . 1111111，则在8位数字的浮点十进算术下， 
(■••((〜 ㊉ x 2 ) ㊉ x 3 ) ㊉ … ㊉ 〜）等于多少？ （ b ) 当等式 （14) 用来计算这些特殊值的标准差时，将 

发生什么情况？当使用等式 （15) 和 （16) 时又发生什么情况？ （ c ) 证明对于所有的^，…，以的选 
择，在 （16) 中 S k >0 o 

17. [28] 写出一个 MIX 子程序 FCMP ， 它比较单元 ACC 中的浮点数《和寄存器 A 中的浮点数 
1 并且按照 w d v ， u〜v 或 w 卜 t ; G )， 把比较指示器置成 LESS ， EQUAL 或 GREATER ; 这里 （ 存在单 
元 EPSILON 中作为一个非负定点量，并假定小数点在该字的左边。假定输入是规格化的。 

18. [ M 40] 在非规格化算术中，是否有一个适当的数 f 使得 

( 0 ? 

► l 9.[ M 30]( W . M . Kahan ) 考虑对〜，…，〜进行浮点加法的下列 过程： 

- ~ c o ~ 0 ; 

: y /； 二 A ㊀ q — 】， h = h — 1 ㊉ ％， c k = ( - i )0^ » 对于 

设在这些运算中的相对误差由等式 

yk = ( 々 -i )( 1 + T ] k ), + ^)0 + 

Q = ((^ - + 7 k ) - y k ) (l + S k ) 

定义，其中 1% I ， k I ， I a I ， I A I 证明〜 = s; =1 (i + e k )x k ，其中 I 久 I d + o(m 2 )。 [定 

理 C 指出 ：如果 6 = 2 和 In I > U I ，则我们恰有 + %二 h - q ，。 但在本题中我们要得到 

一 个估计，它只假定每个运算有有界的相对误差， 而甚至当浮点运算没有仔细地进行舍入时 ，这 
个估计仍然正确。] 

20. [25 ] ( S . Linnainmaa ) 试寻找使得 | w | > | t ； | 且 （47) 不成立的所有 u ， v 。 

21. [ M 35 ]( T . J . Dekker ) 定理 C 指出怎样进行浮点二进数的精确加法。试说明如何进行精 
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确的乘法：以 If + it / 的形式表达乘积 wt ； ，其中 W 和 If 是从两个给定的浮点—进数 w 和 I ，仅仅使 
用运算 ㊉ 、0和®计算出来的。 

22.[ M 30] 在浮点乘/除中能出现漂移吗？给定 "和 1^0,考虑序列： c Q = t /，_ r 2rI + 1 = x 2 ,,® 

V ,X 2ti +2 ^ ^2 n + 1 0 V ;使得2成为可能的最大下标々是什么？ 

► 23. [ M 26] 证明或 否定： 对所有浮点数2 /， wQU Cg 2£> l ) = U 」。 

24. [ M 27] 考虑所有区间[^，^]的集合，其中〜和心或者是非零浮点数或者是特殊符号+ 

0, 一 0, + oo ,- ⑺；每个区间必须有而且仅当〜是有限的和非零的时，才允许〜 

区间 [ u /，^] 代表使得〜的所有浮点: c ， 其中我们认为对于所有正的工， 

- oo < — 工 <-0<+0 <+工 <+ 00 

(于是，[1，2]意味着 1< X <2;[ + 0，1]意味着0<^<1;[ -0，1]意味着 — 0, +0] 表示 
单个值0;而[-⑺，+ oo ] 则代表每个数。）说明怎样对所有这样的区间定义适当的算术运算，而无 

须依靠“上溢”或“下溢”或其它异常的指示，除非以包括0的区间做除数时。 

► 25. [15] 当人们说及浮点算术的不正确性时，他们通常把误差归结为在进行近乎相等的量的 
减法期间出现的“抵消”。而当"和^近似相等时，差 w ㊀I 被精确地得到而没有误差。这些人们 

实际上想说的是什么？ 

26 . [ M 21 ] 给定正的浮点数和 t / 而且 u 〜 t / G ) 和 G ) 并假定采用规格化的 

算术。试证明有一个小的/使得 u ㊉ r 〜 / ㊉〆 （/)。 

27. [ M 27]( W . M . KaKan ) 对于所有 z / 乒0,证明 1 0(1 0(1 0 w )) = l 0 w 。 

28. [ HM 30]( H . G . Diamond ) 假设 /(z ) 是在某个区间 [ :^，〜 ] 上严格地递增的函数，且设 
) 为逆函数（例如，/和 g 可以是 “ exp ” 和 “ In ” 或 “ tan ” 和 “ arctan ”） 。如果工是一个浮点数，使得 

，设 /( x ) = mnnd (/ U )), 而且如果 y 是一个浮点数，使得 / UqXjS / Ca )， 令^ 

(^ y ) — round ( g (^)) ;其次令 h { x ) — g (f ( jc )) ，条件是当它有定义时。尽管由于舍人不总是 
等于工，我们还是期望 & U ) 很“接近于”: c 。 

证明如果精度 V 至少是3,而且如果/严格凹或严格凸（即对于所有在中的： c ， 
/(• X )有相同符号），则在对于所有 X ， 

h { h { h { x ))) - h ( h { x )) 

且等式两边都有定义的意义下，&的重复应用将是稳 定的。 换句话说，如果适当地执行这些子程 
序，将没有“漂移”存在。 

► 29. [ M 25] 给出一个例子说明在上道题中 沪 >3的条件是必要的。 

► 30. [ M 30 ]( W . M . Kahan ) 设对于 jc <1,/( jc ) = 1 + :c + …+ 工 106 = (1 _ 工 107 )/(1 _ X )，且设 

对于0< y < 1， g (: y ) = /(( 士 _ _ y 2 ) (3 + 3 ■ 45 y 2 )) 。对 y = 10 3 , 10 4 ,10 5 , 10 6 ,在一台或多台 

“ 袖珍计算器”上计算 g ( y ) ，并解释你在结果中得到的所有不精确性（因为今天的大多数计算器都 
不正确地舍人，因此这些结果通常是令人惊异的。注意 g (0 = 107 - 10491.35. 2 + 659749.9625. 4 - 

30141386.26625^+ 0(/))。 

31. [ M 25 l ( U . Kulisch ) 当对于 = 408855776和 3 , = 708158977，利用标准的53个二进位的 
双精度浮点箅术计算多项式2/ + 9/ - /时，结果是々 -3.7 x 10 19 。以另一个形式2/ + (3 a ： 2 - 
_ y 2 )(3 x 2 + /) 计算它给出〜 1.0 X 10 18 。 然而，真正的结果是 1.0( 精确地）。试说明如何构造数值 

不稳定性的类似的例子。 
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到现在为止，我们考虑了 “单精度”浮点算术，这实质上意味着，我们所处理的浮 
点值均可存人单个的机器字中。对于一个给定的应用，当单精度浮点算术不产生足 
够的精确度时，通过适当的程序设计技巧还可提高精度，这些技巧使用两个或多个 
存储字来表示每一个数。 

尽管我们将在 4.3 节讨论高精度计算的一般问题，但在这里对于双精度给以单 
独的讨论仍然是适当的。应用于双倍精度的特殊技术，对于更高精度说来，相对地 
是不适 当的； 而且双精度本身也是一个相当重要的课题，因为它是越过单精度之后 
的第一步，而且可应用于不要求极高精度的许多问题中。 

Y 是的，当作者在20世纪60年代撰写本书的头一版时，上一段话是正确的。 
但是计算机已经以这样一种方式发展起来，使得双精度浮点运算的旧的动机大都已 
经 消失； 因此，本小节主要是出于历史的兴趣。在计划中的本书的第4版中， 4. 2 A 
小节将改称“规格化计算”，而本节 4.2.3 小节将被关于“例外的数”的讨论所代替。 
新的内容将专注于 ANS 1/ IEEE 标准754的一些特殊方面 ：非规 范的数，以及表示无 
穷、无定义或者不然就是非寻常的量的所谓 NaNs 。 (请参阅 4.2.1 小节末尾的参考 
文献。）同时，让我们对于较老的思想做最后的回顾，以便了解它们仍可以为我们提 
供什么教训。 

浮点算术，但不是定点算术，几乎总要求双精度计算，也许统计工作除外，在那 
里，普遍使用定点双精度算术计算平方和与 叉积； 由于双精度算术的定点形式比浮 
点形式要更简单些，因此在这里仅限于讨论浮点形式。 

人们经常需要采用双精度，这不仅用来扩充浮点数小数部分的精度，而且用来 
增加指数部分的范围。因此，我们将在这小节讨论在 MIX 计算机中双精度浮点数的 
如下双字 格式： 



这里两个字节用做指数，八个字节用做小数。指数是“余 P /2” 的，其中6是字节大 
小。正负号将出现在最高位的 字中； 完全忽略掉另一个字的符号是适宜的。 

关于双精度算术的讨论将是十分面向机器的，因为只有研究这些子程序编码时 
涉及的问题，我们才能适当地评价这个课题。因此仔细地研究一下 MIX 程序，对于 
理解这一内容是必不可少的。 

在这一节中我们将离开在前两小节中提出的精确性的理想 目标； 我们的双倍精 
度子程序将不舍人它们的结果，有时允许掺进一点误差。用户不敢太信任这些程 
序。在单精度的情况下，我们有充足的理由排除丢失精度的每个可能性，但现在我 
们面对着一种不同的 形势： U ) 为保证在所有情况下都釆用双精度舍人，其额外的程 
序工作量是可 观的； 完全精确的子程序将花费比如说两倍的空间以及另外一半的时 
间。使得我们的单精度程序完善是比较容易的，但双精度使我们直接面对机器的限 
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制。相对于其它浮点子程序，情况与此 类似； 我们不能预期余弦子程序对于所有的 
^都精确地计算 roimcKcosi ), 因为这实际上是不可能的。代替的是，对所有合理的 
x 值，余弦子程序能以合理的速度提供它所能达到的最好相对误差。当然，只要可 
能子程序的设计者应当力图使所计算的函数尽量满足简单的数学定律——例如， 

(~ x ) = I < 1; 对 0< i <： y <7 r ，^ 

( b ) 单精度算术是我们的“主食”，每个要使用浮点算术的人都必须使用它，但双精度 
通常用于此种干净利落的结果并不重要的情形。7位和8位精度之间的区别可能 
是值得注意的，但我们很少注意15位和16位精度之间的差别。在计算单精度的结 
果期间，双精度最常用于中间 步骤； 其全部潜力并非必需的。 U ) 分析这些过程以便 
看看它们可能不精确到什么程度，对我们将是有教益的，因为它们一般地代表在坏 
的单精度子程序中所釆取的截断的类型（见习题7和8)。 

现在我们从上述观点来考虑加法和减法运算。当然，通过改变第二个操作数的 
符号，减法可转换为加法。分别地把低有效位部分和高有效位部分加到一起，适当 
地传送“进位”，就可实现加法。 

然而，出现了一个困难，因为我们做的是“带符号的量”的算 术：有 可能在把两个 
低有效位部分相加时得到错误的符号（即当操作数的符号相反而且较小操作数的低 
有效位部分大于较大操作数的低有效位部分时）。最简单的解法是预先采取正确符 
号； 所以在算法 4.2.1 A 的步骤 A 2 中，我们不仅假定还假定。这 

意味着我们可以确信，最后的符号将是 u 的符号。在其它方面，双精度加法很像单 
精度加法，只是每件事需要做两次而已。 

程序 A (双 精度加法） 子程序 DFADD 把形式为 （1) 的一个双精度浮点数 t ; 加到 
一个双精度浮点数 w 上。假定 r 开始时在 rAX 中（即寄存器 A 和 X )，而 w 开始时 
存放在单元 ACC 和 ACCX 中，答案出现在 rAX 和 （ ACC ， ACCX ) 中。子程序 DFSUB 在同 

样的约定下从 W 减去 

假定两个输入操作数是规格化的，而且答案也被规格化。这个程序的最后部分 
是一个双精度规格化过程，它也被这一节的其它子程序所使用。习题5说明怎样对 
这个程序进行重大改进。 


01 

ABS 

EQU 

1:5 

绝对值的字段定义 

02 

SIGN 

EQU 

0:0 

符号的字段定义 

0 S 

EXPD 

EQU 

1:2 

双精度指数字段 

Ok 

DFSUB 

STA 

TEMP 

双精度减法： 

05 


LDAN 

TEMP 

改变 r 的符号 

06 

DFADD 

STJ 

EXITDF 

双精度加法： 

07 


CMPA 

ACC ( ABS ) 

比较 W 和7； 

08 


JG 

IF 


09 


JL 

2 F 


10 


CMPX 

ACCX ( ABS ) 
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11 


JLE 

12 

1H 

STA 

13 


STX 

U 


LDA 

15 


LDX 

16 


ENT1 

17 


MOVE 

18 

2H 

STA 

19 


LD1N 

20 


LD2 

21 


INC1 

22 


SLAX 

23 


SRAX 

u 


STA 

25 


STX 

26 


STA 

27 


LDA 

28 


LDX 

29 


SLAX 

30 


STA 

31 


SLAX 

32 


ENTX 

33 


STX 



SRC 

35 


STA 

36 


ADD 

37 


SRAX 

88 

1H 

DECA 

39 


ADD 



ADD 

kl 

DNORM 

JANZ 

V 2 


JXNZ 


DZERO 

STA 

hh - 


JMP 

45 

2H 

SLAX 

1^6 


DEC2 


2F 

ARG 

ARGX 

ACC 

ACCX 

ACC 

ARG(2) 

TEMP 

TEMP(EXPD) 

ACC(EXPD) 

0,2 

2 

1,1 

ARG 

ARGX 

ARGX(SIGN) 

ACC 

ACCX 

2 

ACC 

4 

1 

EXPO 

1 

1F(SIGN) 

ARGX(0 ： 4) 

4 

1 

ACC(0 ： 4) 

ARG 

IF 

IF 

ACC 

9F 

1 

1 


如果 \ V \ > \ U \ ，交换 u^v 


(ACC 和 ACCX 处于相邻的单元中 ) 


rll^ - e v 

rI2 —心 

r\l^-e u - e v 

去掉指数 
右调 

0 v 1 v 2 v 4 

v 5 v 6 v 7 v 8 Vg 

在两半都存上真正的符号 
(我们知道 W 有答案的符号) 

rAX—w 

去掉指数 

U ! U2 ^3 11 4 u 5 


EXPO—1( 见下） 

1 tl 5 U 5 U 7 11 g 

一个技巧，见正文中注释 

力口 0 幻7幻8 

从插入的1恢复(符号改变） 
把两个高有效位的部分相加 
(上溢不可能出现） 

规格化子 程序： 

九在 rAX 中，^ = EXPO + rI 2 

如果九= 0,则置〜 — 0 


向左规格化 
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U 7 

1 H 

CMPA 

= 0 = (1:1) 

前导字节为 0 吗？ 

Jt ，8 


JE 

2 B 




SRAX 

2 

(舍入省略） 

50 


STA 

ACC 


51 


LDA 

EXPO 

计算最后的指数 

52 


INCA 

0,2 


53 


JAN 

EXPUND 

它是负的吗？ 



STA 

ACC ( EXPD ) 


55 


CMPA 

=1(3:3)= 

是否多于两个字节？ 

56 


JL 

8 F 


57 

EXPOVD 

HLT 

20 


58 

EXPUND 

HLT 

10 


59 

8 H 

LDA 

ACC 

把答案送入 rA 

60 

9 H 

STX 

ACCX 


61 

EXITDF 

JMP 


子程序出口 

62 

ARG 

CON 

0 


63 

ARGX 

CON 

0 


64 

ACC 

CON 

0 

浮点累加器 

65 

ACCX 

CON 

0 


66 

EXPO 

CON 

0 

“未加工的指数”部分 


当在这个程序中把两个低位部分加到一起时 ，一 个额外的数字“1”插入到已知 
有正确符号的那个字的左边。做完加法后，依照不同情况这个字节可以是 0，1 或2, 

以这种方式同时处理所有三种情况（试把这个方法同用于程序 4.2.1 A 中的颇为麻 
烦的求补方法做一比较）。 

值得指出的是，在执行了行40的指令之后，寄存器 A 可为0;而且，由于当结果 
为0时， MIX 定义零结果符号的方式，累加器包含着当寄存器 x 非0时应附加给结 
果的正确符号。如果交换行39和行40,则程序将是不正确的，尽管两条指令都是 

“ ADD ” ！ 

现在来考虑双精度的乘法。乘积有四个部分，如图4所示。由于我们仅需要最 
左边的8个字节，所以，仅仅处理图解中垂直线左边的数字是适当的。特别是，这意 
味着我们甚至不需要计算两个低位部分的乘积。 

程序 M (双精度 乘法） 这个程序的输入和输出的约定，与程序 A 相同。 


01 

BYTE 

EQU 

1(4:4) 

字节大小 

02 

QQ 

EQU 

BYTE * BYTE /2 

双精度指数的余量 

03 

DFMUL 

STJ 

EXITDF 

双精度 乘法： 

Oh 


STA 

TEMP 


05 


SLAX 

2 

去掉指数 
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06 

07 

08 

09 

10 

11 

12 

13 

n 

15 

16 

17 

18 

19 

20 

21 

22 

23 

25 

26 

27 

28 

29 

30 

31 

32 

33 


STA 

ARG 

STX 

ARGX 

LDA 

TEMP ( EXPD ) 

ADD 

ACC ( EXPD ) 

STA 

EXPO 

ENT 2 

-QQ 

LDA 

ACC 

LDX 

ACCX 

SLAX 

2 

STA 

ACC 

STX 

ACCX 

MUL 

ARGX 

STA 

TEMP 

LDA 

ARG ( ABS ) 

MUL 

ACCX ( ABS ) 

SRA 

1 

ADD 

TEMP ( l ：4) 

STA 

TEMP 

LDA 

ARG 

MUL 

ACC 

STA 

TEMP ( SIGN ) 

STA 

ACC 

STX 

ACCX 

LDA 

ACCX (0：4) 

ADD 

TEMP 

SRAX 

4 

ADD 

ACC 

JMP 

DNORM 


幻 m 

A 


EXPO —~ 〜 

rI2^ - QQ 

去掉指数 

u m X Vi 


X Ul 



(上溢不可能出现) 


把结果的真正符号存起来 
现在准备把各部分乘积加在一起 



(不可能上溢) 


(上溢不可能出现) 
规格化并出口 I 


U U U U U U U U = Urn + €11] 

V V V V V V V V 0 0 = v m + €V] 

x x x x x x 0 0 0 0 = e 2 ui x vi 

x x x x x x x x 0 0 = e u m x vi 

x x x x x x x x 0 0 — e U] x v m 

X X X X X X X X X X _= li m X v m 

w w w w w www w\w w w w w w 0 0 0 0 
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图 4 8 字节小数部分的双精度乘法 


4.2 浮点算术 


注意，在这个程序中小心地处理了符号，还要注意，指数的范围使它不可能利用 
一 个变址寄存器来计算最后的指数。程序 M 也许在精确度方面稍微马虎了点，因 
为它仅仅使用图4中垂线左边的信息，而这会使得最低位字节有多至2的误差。按 

照习题4中的讨论，可以达到更高的精确度。 

双精度浮点除法是最困难的子程序，至少是在这一章中到现在为止我们所遇到 

的最棘手的情况。但实际上，一旦我们看到怎么来做它，就知道它并不复杂得吓人; 

现在把要进行除法的数写成形式十^/)/(^ +叫），其中 < 是计算机字大小的倒 

数，而且假定已规格化。这个分数现在可以展开 如下： 


U m + (Ui 
+ 




U 









⑵ 


由于 0<| 巧 I <1 且 Hb ^\ v m I <1，我们有 I w/il <6,而且删去含有/的项所产 
生的误差可被忽略。因此我们的方法是计算=(^ + WlVm ，然后从结果 


中减去6乘 v m 。 

在下列程序中，行27〜32做双精度加法的较低位的一半，它釆用的技巧不同于 
程序 A ， 而是用另一种方法来保证得到正确的符号。 


程序 D (双精度除法）这一程序采用与程序 A 和 M 相同的约定。 

双精度除法： 

确保上溢标记清除 


01 DFDIV 

STJ 

EXITDF 

02 

JOV 

OFLO 

03 

STA 

TEMP 

OJf 

SLAX 

2 

05 

STA 

ARG 

06 

STX 

ARGX 

07 

LDA 

ACC ( EXPD ) 

08 

SUB 

TEMP ( EXPD ) 

09 

STA 

EXPO 

10 

ENT 2 

QQ + 1 

11 

LDA 

ACC 

12 

LDX 

ACCX 

13 

SLAX 

2 

n 

SRAX 

1 

15 

DIV 

ARG 

16 

STA 

ACC 

17 

SLAX 

5 

18 

DIV 

ARG 


去掉指数 


V 


m 




EXPO^-e u - e v 


rI2^QQ + 


去掉指数 

(参考算法 4.2.1 M ) 

如果上溢，则下面会被发现 


U) 


余数用于进一步的除法中 
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19 

STA 

ACCX 

20 

LDA 

ARGX(1 ： 4) 

21 

ENTX 

0 

22 

DIV 

ARG(ABS) 

23 

J0V 

DVZROD 

u 

MUL 

ACC(ABS) 

25 

SRAX 

4 

26 

SLC 

5 

27 

SUB 

ACCX(ABS) 

28 

DECA 

1 

29 

SUB 

WM1 

30 

JOV 

* + 2 

31 

INCX 

1 

32 

SLC 

5 

83 

ADD 

ACC(ABS) 

Si 

STA 

ACC(ABS) 

35 

LDA 

ACC 

36 

JMP 

DNORM 

87 DVZR0D 

HLT 

30 

38 1H 

EQU 

1(1:1) 


+ U) t 


rA—L I b 4 vjv m I i / b 5 

除法引起溢出吗？ 

近似地 rAX — I vu m v t \ bv m I 

乘以并保存前导字节于 

rX 中 

减 I 叫 I 

加负号 

如无上溢，则再进到高位那 
一 半 

(现在 rA<0) 

rA— | I - I rA I 

(现在 rA >0) 

rA — 连同正确符号 

规格化并出口 

没有规格化或除数为0 


39 mi CON IB- 1, BYTE- l(l ： l) 字大小减 1 | 


下边是这些双精度子程序同相应的 4.2. 1节中出现的单精度子程序近似平均 
计算时间的对比。 

单精度 双精度 

加法 45. 84^ 

减法 49 • 5 u 88 u 

乘法 48 u 109 w 

除法 52 u 126.5 u 

关于把这节的方法推广到三精度浮点小数部分，见 Y . Ikebe,CACM 8(1965), 
175〜177。 


习题 

1.[16] 当 180000 除以 314159 时，对于 < = 4, 试用手算来实施双精度除法的技术。（于 

是，设 （、，〜）= (.180,. 000) 和 （〜，〜）= (.314，. 159), 并用正文中 （ 2 ) 下边一段提出的方法来 
求商 
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2. [ 20 ] 在程序 M 的行30和31之间，插入指令 “ENTX 0”，以便防止留在寄存器 X 中的不需要 
的信息干扰结果的精确度，这是一个好想法吗？ 

3. [ M 20] 说明为什么在执行程序 M 期间不会出现上溢？ 

4. [22] 应该怎样改变程序 M 以实现更大精确性？这实质上是把图4中的垂线右移一位。 
详述所要求的所有变动，并确定由于这些变动所引起的执行时间上的差别。 

► 5. [24] 应该怎样改变程序 A 以实现更大精确性？这实质上是用小数点右边9个字节的累 
加器而不是8个字节的累加器进行处理。详述所要求的所有变动，并确定由于这些变动所引起的 
执行时间上的差别。 

6. [23] 假定这小节的双精度子程序和 4.2.1 小节的单精度子程序被用于同一主程序中。试 
写出一个子程序，把单精度浮点数转换为双精度形式（1)，并写出另一个子程序，它把双精度浮点 
数转换成为单精度形式（如果转换不可能时，它报告指数上溢或下溢）。 

► 7.[ M 30] 试通过如下的办法来估计这小节中的双精度子程序的精确度，即通过找出相对误 
差 

— + ， ((w® v) — ( u X v))l (u X 

((u (Z) v) — (ul v))l (ul v) 

的界 A ，心和 5 3 来做到这一点。 

5 . [ M 28 ] 在习题7的意义下，估计习题4和习题5的“改进的”双精度子程序的精确度。 
9 .[ M 42 ] T . J . Dekker [ Numer . Mar / i . 18 (1971) ，224〜242]提出了 实现双精度的另一种方法， 

它完全以单精度浮点的二迸算法为基础。例如，定理 4.2.2 C 指出，如果 | 2/ | > | I ； | 和进制为2, 

则 w + o = 7U + r ， 其中 = w ㊉ r 和广 =(“㊀㊉ 幻；这里 r | < | 叫 |/2' 所以数偶（切， ;0 可当 

mu ^ v 的一个双精度的变形。为了把两个这样的数偶加起来，即 （ w ，/) ㊉ （ no , 其中 
| I < I “ |/2 〃和 |z/ I < I W 1/2 〃 且 U I > I u I ， Dekker ■建议（精确地）计算 u + v = w+ r ， 然后 
计算 s = ( r ㊉ l/ )@i/( 一 个近似的剩余），最后得到 （ W ㊉ S ， （ wQ( 切 ㊉ S)) ㊉ >5 )。 

当这个方法递归地用于产生四倍精度的计算时，研究它的精确度和有效性。 

4.2.4 浮点数的分布 

为了分析浮点算术算法的平均特性（特别是确定它们的平均运行时间），我们需 
要某些统计信息，以便确定各种情况出现的频繁程度。这一小节的目的是讨论浮点 
数分布的经验的和理论的性质。 

A . 加法和减法程序 一个浮点加法和减法的执行时间在很大程度上依赖于指 
数的初始差，也依赖于（向右或向左）规格化所需的步骤数。尚不知道有什么方法来 
给出一个好的理论模型，能告诉我们可预期的特征是什么，但是 D . W . Sweeney 已经 
做了广泛的经验研究 [JBMSysfems 4 (1965) ，31 〜 42] 。 

借助于一个特殊的跟踪程序， Sweeney 运行了 6个选自不同计算实验室的“典 
型”大型数值程序，并十分仔细地考察了每一个浮点加法或减法运算。为收集这些 
数据做了 25万次以上的浮点加减，受检验的程序所执行的每10条指令中大约有一 

条是 FADD 或 FSUB 。 

通过先对第二个操作数取负，可以把减法看做 加法； 因此，可以像只做加法那样 
来给出所有的统计， Swee ney 的结果可以综述 如下： 
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大约有9%的时间，发现要相加的两个操作数之一等于零，而这通常是累加器 
( ACC ) o 其它的91%的情况大致相等地分成为运算数有相同的符号和相反的符号两 
种情况，以及大致相等地分成|〃|<^|和 h |<U I 两种情况，大约有 1.496 的时 
间计算答案为零。 

对于各种进制的6,指数之间的差近似地有由表1所示的概率给出的一个特性 
(此表“5以上”的行实质上包括当一个操作数为0时的所有情况，但“平均行”不包 
括这些情况）。 


0 


2 


3 


4 


5 


以上 


平均 


表 1 在加法之前进行操作数调整的经验数据 


b = 2 

6 = 10 

b = 16 


0.33 

0.47 

0.47 

0.56 

0.12 

I 

0.23 

0.26 

0.27 

1 

1 

0.09 

0.11 

0.10 

0.04 

0.07 

0.03 

0.02 

0.02 

0*07 

0.01 

0.01 

0.02 

CL 04 

0.01 

0.02 

0.00 

0.28 

0.13 

0.11 

0.09 

3.1 

0.9 

0.8 



当 M 和有相同的符号且均已规格化时^或者需要右移一位（对于小数 
上溢），或者根本不需要什么规格化移位。当 W 和 W 有相反的符号时，在规格化期间 
要进行零次或更多次左移，表2给出了所观察到的需要的移位 次数； 这个表的最后 
一 行包括结果为零的所有情况，每次规格化时平均移位的次数，当 b =2 时大约为 


0.9,当6 = 10时或6 = 16时大约为0.2,而6 = 64时大约为0.1。 

表 2 做了加法之后进行规格化的经验数据 



h - 2 

6 = 10 

6 = 16 

6-64 

右移 1 位 

0.20 

0.07 

0.06 

0.03 

不移位 

0.59 

0.80 

0.82 

0.87 

左移 1 位 

0.07 

0.08 

0.07 

0.06 

左移 2 位 

0.03 

0.02 

0.01 

0,01 

左移 3 位 

0.02 1 

0.00 

0.01 

0.00 

左移 4 位 

0.02 

0.01 

0.00 

0.01 

左移 > 4 位 

0.06 

0.02 

0.02 

0.02 


B . 小数部分 对浮点程序的进一步分析可以以随机选择的规格化浮点 数小数 
部分的统计分布为 基础。在这种情况下，事实是十分令人惊奇的，并且有有趣的理 
论来解释观察到的不寻常现象。 
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为方便起见，暂且假定我们正处理浮点十进算术（即以10为进 制）； 下列的讨论 
可以非常直截了当地修改成任何其它正整数进制6。假定我们有一个随机的正的 
规格化的数 U ，/) 二10 〜 /。由于/是规格化的，我们知道它的前导数字为1,2,3, 
4,5,6,7,8或9,而且假定前导数字中的每一个都将有1/9的机会岀现似乎是合乎 
自然的。但是事实上，实际的特性却并非如此。例如，竟有30%以上的时间前导数 
字趋向等于1! 

检查刚才所作论断的一种方法，是从某些标准参考文献取一张物理常数（例如， 

光速、重力加速度）表。例如，如果考察 Handbook of Mathematical Functions ( U . S . 
Dept of Commerce , 1964), 我们发现在表 2.3 中给出的 28 个不同物理常数中竟有8 

个，大约占29%,其前导数字等于1。对于 l < n <100 的 n !的十进值恰有30个以 
上以1 开头； 对于 l < n <100,2” 和的十进制也如此，我们也可以考察人口调查 

报告，或者一份农业年鉴（但不是电话号码簿）。 

在袖珍计算器岀现之前，一些对数表前头的若干页势必用得十分脏，而后边的 
部分则保持得相当干净和整洁。这一现象首先是由美国天文学家 Simon Newcomb 
明确提到的 [ Amer . J . Mafh . 4 ( 1881 ) , 39〜40 ] 。他给出了很好的论据使人们坚信， 
前导数字 d 以 log 1() (l + l / d ) 的概率出现。许多年以后， Frank . Benford 才从实践经 

验中发现了相同的分布，他报告了取自不同来源的20 229个观察结果 [ Proc . Amer . 

Philosophical Soc . 78 (1938) ，551 〜 572] 。 

为了解释这个前导数字法则，让我们对于以浮点记号写数做更仔细的观察。如 
果取任何正数〃，则它的前导数字由公式 10 A = 10 ( bg ^ ) m ° dl 确定； 因此前导数字小 

于 d 的充要条 件是： 

( log 10 w ) mod 1 < log 10 ^ (1) 

现在如果有从在自然界中可能出现的某个合理分布中选择的“随机”正数则 
可以预期，至少很近似地， （ log 1() U ) mod 1将一致地分布于0和1之间（类似地，我 

们可预期 U mod 1 , U 2 mod 1 , V U + n mod 1 等等，是 一 致分布的。按实质上相同 

的理由，我们可以预期轮盘赌的轮子是无偏倚的）。因此，由（1)，前导数字将是1的 
概率为 l ogl0 2〜 30. 103%。数字是2的概率为 log 10 3 - log 10 2〜 17. 609% ; —般地， 

如果 r 是1与10之间的实数值，则我们应该近似地有 log 10 r 的机会得到 l 0 f v < r o 

前导数字趋向于是小的数字这一事实，使得浮点计算的“平均误差”估计这一最 
明显的技术成为无效的。 

当然只可以说，上边的启发式的论证并未能证明所述的法则。它仅仅向我们说 
明了为什么前导数字有这种特性的一个似乎有理的原因。 R . Hamming 已经提出了 
分析前导数字的一个有趣的方法：设 W ㈠ 是 I 0 f v < r 的概率，其中 l < r <10, 且 

f v 是一个随机规格化浮点数的规格化的小数部分。如果考虑现实世界的随机 

量，则我们发现，它们是通过任意的单位来测 量的； 而且，如果我们去改变一米或一 
克的定义，则许多基本物理常数都将有不同的值。现在假设，宇宙中的所有数突然 
地乘以一个常数因子 c ; 则随机浮点量的世界在这个变换下实质上应该保持不变， 
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所以 p ( r ) 不应受影响。 


每个数都乘以 


的结果是把 （ log 10 L 7) mod 1 变成 （ log 10 L 7 十 log 10 c ) mod 1。现 


在该是建立描述所希望特性的公式的时 候了； 可以假定 l < c <10, 由定义， 


p(r 

由我们的假定，我们也应有 




Pr (( log 10 U ) mod 1 < log 10 


P ( 


r 




Pr ( dog 10 u + log 10 c)mod 1 < log 10 r ) 

fPr (( log 10 U mod 1) < logio 厂 - logio 


或 


( log 10 U mod 1) > 1 - log 10 c )， 


如果 




Pr (( log 10 U mod 1) < log 10 r + 1 - log 10 c 


且 （ log 10 L 7 mod 1) > 1 - logio 


如果 c > 



= t pu 

~ \p(io 

现在通过定义 p (10 V ) 



+ 1 - p(10l 

c) - p(10lc, 


) ，如果 
，如果^ 







⑵ 



P ( 



+ n ， 把函数 /)( r ) 推广到范围之外的值 


去； 这样，如果以^代替 10/ c ， 则 （2) 的最后一个等式可以写成 


p(rd) 


P ( 




p(d) 


⑶ 


如果我们所做的关于乘以一个常因子后分布不变性的假定成立，则等式 （3) 必然对 


所有 r >0 和成立。现在 ^(1) 


0 ^( 10 ) 


1的事实意味着 


P(10) 


p((7To) n 


p(7Yo) 



p((7Yo) n 


1 


np (v^TO) 


因此，对于所有正整数 m 和72,我们导出 p ( lQ mh > mln 。 如果现在决定要求夕是 
连续的，则我们不得不作岀这样的 结论： Mr ) = log ，， 而这正是所需的定律。 

尽管这一论断比头一个可能更使人信服些，但如果我们坚持概率的习惯概念， 
则在深究之下，它并不真正成立。使上述论证严格化的传统方法是，假定有某个基 
本数字分布 FU )， 使得给定的正数 U < u 的概率为 FU ); 则我们所关心的概率是 


P ( 



^(F(10 m r) - _F(1(T)) 


⑷ 


m 


其中对于所有的值-⑺< m <⑺求和。我们关于比例不变量和连续性的假定导致 
了下列结论： 


p ( 


logio 


利用同一论断，我们可以“证明”对每个正数6>2,当时有 


^(F(b m r) - F(b m )) 


log 


r 


⑸ 


但是不存在分布函数 F ， 它对所有这样的6和 


满足这个等式！（见习题7。) 


摆脱这种困境的一种方法，是把对数 法则 〆 


Iog 10 r 仅仅看成是真正分布 


的一个非常接近的近似。真正的分布本身也许随宇宙的扩展而可以改变，并且随着 
时间的推移变成越来越好地 近似； 而且如果我们以一个任意的进制6来代替10,则 
随着纟 之增大，近似反而变得更不精确了（在任意给定的时间里）。摆脱这一困境的 
另一比较合适的途径，是拋弃分布函数的传统思想，这已由 R . A . Raimi 提出来，见 
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AMM 76 (1969) ，342 〜 348。 

上段的模棱两可的说法，大概是非常令人不满意的说明。所以下边进一步的计 
算（它坚持严格的数学论证，避免任何直觉的然而似是而非的关于概率的观念）应该 
是受欢 迎的： 考虑正整数前导数字的分布，而不考虑某个想像的实数集合的分布。 
这一课题的研究是十分有趣的，不仅是由于它在一定程度上阐明了浮点数据的概率 

分布，而且也构成了一个特别有教益的例子，说明如何把离散数学的方法同无穷小 
的微积分方法结合起来。 

在下边的讨论中，设 r 是一个固定的实数，我们将试图给出对 p ( r ) 
的一个合理定义，即在一个“随机”的正整数 N 的表示 10 e v / N 中， 10/ N < r 的概率， 

并假定其精度是无限的。 

为了开始，让我们试验像 3.5 节的 “ Pr ” 定义那样，利用极限方法来找这个概率， 
不妨把该定义重新表述 如下： 

Po ( n ) ~ [n = 10 e • /，其中 10/ < r ] = [ ( log 10 n ) mod 1 < log 10 r ] (6) 

现在 P Q (1)， P G (2)， …是 0 与 1 的无穷序列，同时诸 1 表示贡献于我们正在寻求的 
这一概率的情况，我们可以通过定义 




(7) 


来对这个序列取“平均”，因此如果利用第3章的技术生成1与 n 之间的随机整数， 
并把它转换成浮点十进形式 （ e ， /) ，则 10/<r 的概率恰是 jPJt ?)。 令 lim^ odPi 

U ) 是我们所需要的“概率” 〆 r ) 是很自然的，而这恰恰是我们在 3.5 节中所做过 
的。 


但在这种情况下极限并不存在，例如，考虑子序列 

P { ( s ) y P ,( l 0 s ) ^ P . dOOs ) r - 

其中 s 是一个实数， l < s <10。 如果 s < r ， 则我们发现 


Pi(io n s) = 士 ( 「 rl- 1 + 「 10 厂 1- 10 + … 十「 10" 一 1 厂 1 - io ” _1 +L 肌」十 1 - io ;, ) = 

11 ) 5 


r ^ r ( r(l + 10 + …+ lO ^ 1 ) + O ( n ) + L 10、」-1-10 -…-10” = 

1U 5 


+ — 10” + 1 ) 十 L 10 〜」十 OU )) (8) 

因此，当72 — 00时，尸 1 (10、）趋向于极限值1 +卜-10)/^。只要我们以 「10” r 1 代替 
L 10~」+ 1， 上述对于的计算就可修改成使它对于也 成立； 所以当 5 >r 

时，我们求得极限值是 10( r - 1)/9〗。[见 J . Franel , Naturforschende Gesellschaft , 
Vierteljahrsschrift 62 ( Ziirich : 1917)，286 〜295。 ] 

换言之，序列有子序列 〈 JVICTO 〉， 当 5 从 1 变到 r 又变到10时，它 

的极限从 （ r _ l )/9 上升到 10( r - l )/9 r 而后又下降到 （r - 1 )/9 。我们看到 P x ( n ) 

当 n — 00 时没有 极限； 而且对于很大的 rz ， PS ( /? ) 的值也并不特别近似于我们猜测 
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的极限 log 10 r ! 

由于 U ) 并不趋于一个极限，我们可以再次尝试使用和 （7) 同样的思想，用平 
均的办法来消除异常特性。 一 般来说，设 




n 


n 




(9) 


则 P W + 1 U ) 将趋于成为比 P W U ) 特性更好的序列，我们试一下用定量的计算来证 
实这 一点； 对于 m =0 的特殊情况，我们的经验指出，可能值得考虑子序列 P m + l 


(10^) o 事实上，可以导出下列 结果: 


引理 Q 对于任意的整数 m >1和任意实数 （ > 0 ，存在函数 Q m ( s ), R m ( s ) 和一 
个整数 N m U ) ，使得当 n > N m (( ) 和1< 5 <10时，有 

I P m ( lO n s ) - Q m ( s ) - R m ( s)[s > r \ \ < ^ (10) 

而且函数<^(5)和 R m (S )满足关系 




(t )d^ + 


5 







10 




J 





Qo ( s ) = 1, Ro ( s ) = - 1 
证明考虑由 （11) 定义的函数⑴和 i ^(5)， 并命 

S m ( t ) = Q m { t ) 4 - R m ( t)[t > r ] (12) 

我们将对 m 用归纳法来证明这一引理。 

首先注意 Qi ( 5 ) = (1 + (s — 1) — (10 - r )/9) /5 = 1 + ( r - 10 )/9 s ， 及 R -[( s ) - 

( r - s ) lso 由 （8) 我们求得 

liMlO 、） _ 士⑴丨= 0( n)/lCT 

当 m = l 时，就证明了引理。 

现在对于 m > l ， 我们有 


P m ( lO tl s ) 




S . 


10 


■Pm-i 


U) + 


1 ⑷） 

10 

我们要逼近这个量。由归纳法，当 l < g <10 且时， 


S . ⑴ 

l0 J ^k^l0 J g 



■ 


10 


— 1 


!/丄) 
\10 ; y 



小于由于是连续的，故它是黎曼可积函数，而且由积分定义，对于大于 
某个数 iV 的所有 J ，与 g 无关，差 


■ ■ 
10 ； <A<10 ； 9 



9 

)dt 


(14) 
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小于6。我们可以选择 N 为大于 — 者。因此，如果 M 是对所有正整数 ； 成立 
的 （13) + (14) 的上限，则对于 n > N ，差 


以 


P m HO n s) 








sp n M 

^j=0 IQ^-J 




N< j< n 


_11U_ 
10"— ， 


+ lie 


为界。最后，岀现于（15)中的和20 <;< 八1/10”~)等于（1-1/10”）/9;所以如果71取 
得足够大，就可以使 


Prn(lO^s) 


1/1 

no 

、 / X \ 

r \ 

S w _! ( t )dt + 

S m -! ( t)dt 

s \ y o 

1 - 

i ) 


小于比如说 20 b 把这同 （10) 和 （11) 比较就完成了证明。 | 


引理 Q 的要旨在于我们有极限关系 

UmP m (10 ri s) = S m (s) ( 16 ) 

oo 


而且，由于当 S 变动时 S w ( s ) 不是常数，故极限 

l\m P m (n ) 

(它本应是我们所希望的概率）对任彳4 m 都不存在。这一情况展示于图5中，它示 
出了当 m 小且 r = 2时 Sjs ) 的值。 



图 5 前导数字为 1 的概率 

即使不是一个常数，以致于我们对于 i \ U ) 不能有一个确定的极限，只 
要注意图5便可知道，对于 m =3， S , n (5) 的值已经非常接近于 log 1() 2 二 0.30103 …。 

S 此，我们有充分理由猜测，对所有大的 m ， S w G ) 非常接近于 bg 1 Q r ， 而且事实上， 
函数 〈\, U )〉 的序列一致地收敛到常数函数 log 1() r 。 
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明确地对所有772计算和只 
上述猜想是有趣的： 


m 


S 


，如同在证明以下的定理中那样，来证明 


定理 F & S m ( s ) 是 （16) 中定义的极限，对所有々0,存在一个数 NG )， 使得当 


w > NG ) 时，对于 


S 


7)1 


s ) - log 10 r \ < e 


(17) 


证明鉴于引理 Q , 如果能证明存在一个与 f 有关的 M ， 使得对于和 


对于所有，我们有 


Q m ( s ) - log 10 


< 




及 


R m 、$ 


< 


(: 


(18) 


则我们就能证明这个结果 


o 


不难对 JRm 来解递推公式 （11) :我们有 Rq(s) = ^ I J R { ( s ) = - 1十 rl s yR 2 ( s ) 



r / s)(l + Jn ( s / r )) ， 而 一 般地 


Rm ( s ) 




_ 1 


r 




In 


s 


s 




m 


- D ! 


In 


s 


m 


1 


对于所述的 


S 


的范围，这一致地收敛到 -i 



r s )ex 


p ( ln (5 / r )) 


r 


o 


(19) 


o 


Q m 的递推公式 （11) 具有形式 


Q 


1 


m 


S 


S 


C m + 1 



5 




( 20 ) 


其中 


C 


m 



10 


Q m ^ l ( t)dt + 


10 


R 


m 




( 21 ) 


再次地通过试验开头少数情况，并推测一个可由归纳法证明的公式，容易求出递推 
式 (20) 的解； 我们发现 


Q 


m 


S 



C 


S 


m 





In s + …+ 


1 


m 


- D ! 


c ! (In s 


m — Y 


( 22 ) 


对我们说来，剩下的是计算系数由（19)， （21) 和(22)，它满足关系式 


C 


- 10)/9 


C m 十1 



c m In 10 



^yc^-idn 10) 2 + 


+ 


m ! 


Ci (In 10) 


m 



1 


r I 1 + ^- In 


10 




+ 


■ m 


•十 


1 / 


m ! 


In 


10 


m 


- 10 


(23) 


r 


这个序列最初从外表上看非常复杂。实际上不难借助于生成函数对它进行分析。 



c( 


2： 




C'iZ C2Z 



C 3 Z 



则由于 10 z = l + z In 10+ ( l /2 !)(z In 10) 2 + …，我们导出 



+ 1 一 


10 Cm 



10 


c 


m + 


1 


10 


c 


m + 



c m In 10 




ml 


ci (In 10) 


m 
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是函数 






10 


C ( z )10 


z 



r 


no 


z 


10 


2： 


r 


1 - z j 


z 


1 — z 


(24) 


中 


z 


m 


的系数。这个条件对 m 的所有值都成立，所以 （24) 必然等于 CU )， 而且我 


们得到显式 


C ( z ) 




我们要来研究的系数的渐近性质，以完成我们的分析。 （25) 中的大圆括号中 
的因子当 z ^ l 时趋于 ln (10/ r )/ In 10 = 1 - log ， ，所以我们看到 



z < 



2ttl 
In 10 


中复变量 z 的解析函数。特别是，对于 z = 收敛，所以它的系数趋于零。这 

就证明了 CU ) 的系数有像 （ i og 1 Q r - i )/( i - Z ) 的系数那样的特性，即是 


lim c m = log 10 r - 1 

— 00 


最后，我们可以把这同 （22) 结合起来，以证明 Q W U ) 对于—致地趋于 



log ， _ 

S 




響參黪 


logio 厂 



因此，我们已经通过直接计算，建立了对于整数的对数定律。同时看到，它是对 
于平均行为的极好的近似，尽管它绝不能精确地达到。 

上边给出的引理 Q 和定理 F 的证明是 B . J.Flehmger &4 MM 73 (1966),1056 

〜 1061中的方法的简化和扩充。许多作者已经写了关于初始数字分布的论著，并 

证明对数法则是许多奠基性的分布的一个好的 近似； 关于这方面著作的广泛评论， 
见 Ralph A . Raimi 的综述 ,AMM 83 (1976) ，521 〜538，以及 Peter Schatte , J . Infor - 

mation Processing and Cybernetics 24 (1988)，443 〜455。 

习题 17 讨论了定义概率的一个方法，在这方法之下，对数定律对整数精确地成 
立。而且习题18揭示了对于整数的概率的任何合理的定义必然导致对数定律成 
立，如果它对前导数的概率赋一个值的话。 

当然，浮点计算主要地是对非整数进行运算；由于对于整数的熟悉和其简单性， 
我们已经研究了整数。当考虑任意实数时，理论结果更难得到，但是对于实数的计 
算将接近于总是趋于产生对于小数部分的对数分布越来越好的近似，在这个意义下 
有越来越多的证据表明，相同的统计是适用的。例如 ， Peter Schatte [ Zeitschr//f fur 
angewandte Math , und Meehanik 53 (1973) ， 553 〜 565 ] 证明，在温和的限制下，独立 

的相等分布的随机实变量的乘积趋向对数分布。这种变量的和也如此，只不过是在 
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重复平均的意义下 。 J * L . Barlow 和 E . H . Bareiss 已经得到类似的结果 [Computing 

34(1985)，325〜347]。 

习题 

1 . [ 13 ] 如果 w 和 d 是有相 同符号 的非零浮点十进制数，则按表1和表2,在计算 u ㊉ v 时出 
现小数溢出的概率是多少？ 

2 . [ 42 ] 试对浮点加法和减法做进一步的检验，以确认或改迸表1和表2的精度。 

3. [15] 按对数定律，浮点十进制数的两个前导数字是“23”的概率等于多少？ 

A .[ M 18 ] 正文中指出经常使用的对数表前边一些页要比后边一些页脏。如果我们有一份 
反对数表，即当给定 \og lQ x 时，给出： r 的值的一份表，则情况如何？这样一份表的哪些页最脏？ 

► 5.[ M 20] 假设 L / 是在区间0< U < 1 中一致分布的一个实数。问 L ； 的前导数字的分布是什 

么？ 

6. [23] 如果我们有 〃 + 1 位的二进制计算机字，则我们可以使用 f 位于浮点二进制的小数 
部分，使用1位于符号部分，使用〃 - p 位于指数部分。这意味着可表示的值的范围，即最大的与 

最小的规格化正值的比例，实质上是同样的计算机字可以用来表示浮点十六进制的数，即 
进制为16,小数部分 f + 2位 （（^+2)/4 个十六进数宇），以及指数部分 n - p -2 位的浮 点数； 此 

时值的范围和以前一样，是 16 2 n _ P _2 =2 2 ^， 只是小数部分的位数更多了。这看起来好像我们不 
花任何代价而得到了收获，但是进制16的规格化条件是较弱的，原因在于在小数部分中可以有多 
达三个前导0数字。于是，并非所有^ + 2位都是“有效位”。 

在对数定律的基础上 ，一 个十六进制正的规格化浮点数的小数部分恰有0个，1个，2个和3 
个前导0数字的概率是多少？试讨论十六进制相对于二进制的优点。 

l .[ HM 28 ] 证明，对于每个整数以及对于所有在范围中的实数值 r ， 没有满 
足 （5) 的分布函数 F ( u ) 0 

8. [ HiVT 23] 当 m = 0 时， （10) 对于适当的 iV G (0 是否成立？ 

9. [ HM 25 ] ( P . Dmccmls ) 设…是根据等式 （9) 重复地平均一个给定函数 
P Q U ) 所定义的任何函数序列。证明对所有固定的 n，lim P m ( n ) = P Q ( l)o 

m -^ oo 

► 10. [ HM 2 S ] 正文中的论断证明 ， k = l 0 g i (3 r -1 + k ， 其中 b 当 m — oo 时趋于0,试求出 c 7/; 
的渐近展开式的下一项。 

n.[M15) 证明，如果 LJ 是按照对数定律分布的一个随机变量，则1/以也是。 

12. [ HM 25]( R . W . Hamming ) 本题的目的在于证明浮点乘法的结果趋于比操作数更精确地 
遵守对数定律。设 L ； 和 V 是规格化的随机正浮点数，它们的小数部分分别以密度函数 / U ) 和 
gU ) 独立地分布。于是，和 f v ^ 3 的概率是 _f [//j \ iJ (^) g ( y)dy dx ， 其中设 
/ iU ) 是 L/x V (未舍人）的小数部分的密度函数。定义一个密度函数/的 异常性 /\(/)为极大相 
对误差 

A ( f ) = max 

\ I 

其中 i { x ) = \Kx In 6) 是对数分布的密度函数。 

证明 AU )< min ( A (/)， A ( g ))。 （特别是，如果两个小数有对数分布，则乘积也是。） 

► 13. [ M 20] 浮点乘法程序算法 4.2. IV [在规格化时，依赖于是否有 人人 >1/6,而要求左移0 
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次或1次。假定输入操作数按照对数定律独立地分布，问结果规格化时不需左移的概率是多少？ 

► 14.[ HM 30] 设 L ； 和 V 是随机规格化的正浮点数，它们的小数部分是按照对数定律独立分 
布的。且设九是它们指数的 差为々 的概率。假定指数的分布与小数部分的分布无关，试给出在 

I 

进行浮点加法 ㊉V 期间“小数溢出”的概率公式，用进制6和量/^，川，/> 2 ，…表示，把这个结果 
同习题1做比较（忽略舍人）。 

15. [ HM 2 S ] 设 U ， "，/^，/^，…如习题14所示，并假定使用进制10的算术。证明不 管％， 
以，％，…的值为何，和数 U ㊉V 不会精确地遵守对数定律，而且事实上 ㊉V 有前导数字1的概 
率总是严格地小于 logu )2。 

16. [ HM 28 KP . Dmconis ) 设对于每个是0或1，并像在 （9) 中那样，通过重复平均来 
定义“概率” p w + i (72) ，证明如果 limPi ( rz ) 不存在，则对于任何也不存在。[提 示: 

n—^ 00 7 ?— 30 

证明对于某个固定常数 M >0，当我们有 （a j +…+ )/ ?? — 0和、+ 1 + M / 77时， a ,,—0] 。 

► 17. [HM25] ( M . Tsuji ) 定义 Pr(S(n)) 的值的另一个方法是计算量 lim„— M ( H ； 1 • 

可以证明只要 Pf ( SU )) 按照定义 3.5 A 存在，这个调和概率就存在而且等于 
Pr ( S ( n ))。 试证明命题 “（ log 1() n ) mod 1< r ” 的调和概率存在而且等于 r 。（因此在这个意义下整 
数的初始数字精确地满足对数定律。） 

► 18. [ HM 30] 设 P ( S ) 是任何在正整数集合 S 上定义的真值函数，但不必是在所有这样的集 
合上定义，并满足以下较弱的公理： 

0如果 P ( S ) 与 P ( T ) 有定义且 S (] T =0 P ( S [ jT ) = P ( S )-^ P ( T ) 0 

ii ) 如果 P ( S ) 有定义，则 P(S + 1) = P ( S )， 其中 S + l=\n + l \ neS\o 

iii ) 如果 P ( s ) 有定义，则 P (2 S ) = + P ( S ), 其中 2 S = |2 n heslo 

iv ) 如果 S 是所有正整数的集合，则 P ( S ) 二1。 

V) 如果 _ P ( S ) 有定义，则 P(S)>0o 

另外，假定对于所有正整数 a ， P ( D 有定义，其中是所有其十进制表示以 a 开始的整数 
的集合 

L a = U | 10 w, a ( n < I 0 m (a + 1), 对某个整数 mi 
(在这个定义中， m 可以 为负； 例如，1是 L 1 Q 的一个元素，但不是的元素。）证明对于所有整数 

,P(L fl ) = log 10 (l + 1/a )。 

19. [ HM 25] ( R . L . Duncan ) 证明斐波那契数的前导数字遵守小数部分的对数 定律: 
Pr ( 10/ p „ K r ) = logio , 0 

20. [HM40 ] 通过求出当 n — ⑺时 h (10、）- S w G ) 的渐近特性，使 （16) 更精确。 


4.3 多精度算术 

现在我们考虑有任意高精度的数的运算。为考察的简便性，假定考虑的对象是 
整数而不是一个嵌人了小数点的数。 

4.3.1 经典算法 

在这一小节中，我们将讨论下列运算的一些算法。 
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a ) n 位整数的加法或减法，给出一个72位的答案和一个进位。 

b ) 72位整数与 m 位整数的乘法，给出 （m + 7?) 位的答案。 

c ) m + n 位整数除以 n 位整数的除法，给出一个 （m + 1) 位的商和 n 位的余 

数。 

这些可以叫做 “经典算法” ，因为在若干世纪中，仅当同这些过程相联系时才使 
用“算法”一 词。〃 位整数一词，指的是小于 V 的任何整数，其中6是表达数的常规 
位置记法的进制，在这个记法中这样的数至多需要 n 个位置。 

把整数的经典算法应用到含有小数点的数，或者扩充精度的浮点数，这些都是 
直截了当的事，其方式就像把在 MIX 中对于整数定义的算术运算，应用到这些更为 
一般的问题上那样。 

在这一节中，我们将研究对于6进制记法下表达的整数，进行上述 a )， b ) 和 c ) 
运算的算法，其中6是任意的大于或等于2的整数。这样，这些算法是算术过程的 
十分一般的定义，因而它们是与任何具体的计算机无关的。但这一节中的讨论也是 
有一点面向机器的，因为我们主要关心的是由计算机进行高精度计算的有效方法。 
尽管我们的例子是以假想的 MIX 计算机为基础的，实际上同样的考虑几乎适用于每 
台其它的机器。 

为了了解扩充精度的数，最重要的事实是它们都可看成以 w 进制记号写成的 
数，其中 w 是计算机的字大小。例如，在一台字大小为 W = 10 1 Q 的计算机上，占10 
个字的整数有100个十进制 数字； 但是我们把它当做一个10 1() 进制的10位的数。 
这个观点是正确的，正如我们可以简单地把一些位合在一起来实现从二进制记号转 
换成八进制记号一样（见等式 4. 1-(5))。 

在这些约定之下，我们有下列基本 运算： 

ao ) 一 位整数的加法和减法，给出一位的答案和进位。 

bo ) —位的整数乘以另外一位整数的乘法，给出一个两位的答案。 

c 0 ) 一个两位的整数除以一个一位整数的除法，假定商是一位的整数，而且产生 

的余数也是 一 位的。 

如果必要的话，通过调整字长，则几乎所有的计算机都有这三种运算可用，因而 
我们就能借助于基本的运算 ao )， b Q ) 和 c 。） 构造上述算法 a )， b )* c )。 

由于把扩充精度整数具体化为进制纟的数，因此设想6 = 10,并设想用手进行 
算术运算的情况有时是有帮助的。这样就使运算 aj 类似于记忆加法表， b Q ) 类似于 

记忆乘法表，而 c Q ) 实际上是反过来记忆乘法表。因此高精度数的更为复杂的运算 

a )， b )， c )， 就可用在初等学校所学的简单加法、减法、乘法和长除过程来进行。事实 
上，我们在这一小节里所要讨论的大多数算法，都不过是熟知的纸笔运算的机械化。 
当然，必须指出，这些算法比起五年级时所学的要精确得多，而且我们还打算把计算 
机存储空间和运行时间尽可能缩小。 

为避免繁琐的讨论和麻烦的记号，假定我们处理的所有数据都是非负的。计算 
符号等附加工作也是十分直截了当的，尽管当在不使用带符号量表示的计算机上处 
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理补数时需要 小心。 这样一些问题会在本小节接近末尾处讨论。 

首先来看加法，它当然非常简单，但它值得仔细研究，因为同样的思想也出现在 
其它算法中。 

算法 A (非负整数的加法） 给定非负的 n 位整数（、- i — 2… W 6 和 （ 一 i 

本算法形成它们的6进制和 （- 丨…叫 IUq ) 纟。这里是“进 
位”，而且总是等于0或1。 

A1 • [初始化]置7 —0 ， 々 —0 。 （变量 J 将跑遍各个数字位置，而变量々记住在 

每个步骤的进位。） 

A2 •[加数字]置 uj 广 （ 〜+ v】 + k) mod 以及 k ( Uj + Vj + k )1 b \o (由关 

于计算的归纳法，我们将总有 

Uj + Vj 十々 <(6 — 1 ) + (6 — 1 ) 十 1 < 26 

因此依赖于有无进位出现 J 被置成0或1，等价地，々—[~ + Vj + k> 

b ] 0 ) 

A 3 .[对 7 _进行循环] j 加 1。 现在若 〃， 则返回步骤 A 2; 否则置％—匕并 

终止这一算法。 ■ 

关于算法 A 成立的形式证明，见习题4。 

这个加法过程的 MIX 程序，可以采取如下 形式： 

程序 A (非负整数的加法）设 L 0 C ( w ; )=U + j , L 0 C(^)^V + j , L 0 C (^ ; )^ W + j , 

rll =7 - n y rA=k ，字的大小三 6 ,N= n 0 

■ 

01 ENN 1 N 1 Al. 初始化 o 

02 JOV OFLO 1 确保溢出开关断开 

03 1 H ENTA 0 N + 1 - K 々—0 

J 1 Z 3 F N + 1 — K 如果 j = n ， 则退出循环 

05 2 H ADD U + N，l N A2 .加数字 

06 ADD V + N，l N 

07 STA W + N ,1 N 

08 INC 1 1 N A3 .对进行循环 。+ 1 

09 JNOV IB N 如果无溢出，则置 々—0 

10 ENTA 1 K 否则置 1 

11 JIN 2 B K 如果 j < n ， 则转 A 2 

12 3 H STA W + N 1 在中存最后进位 ■ 

这个程序的运行时间是 10 N + 6 个周期，同进位的次数 K 无关。在这小节的 
末尾对量 K 进行了详细分析。 

对算法 A 可以进行许多修改，而在下边的一些习题中仅提到其中一些修改。关 
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于这个算法的推广，可用“如何为一台数字计算机设计加法线路”这样的标题。 

减法的问题类似于加法，但其差别是值得注 意的： 

算法 S (非负整数的减法） 给定非负”位整数 (〜 

幻1幻0)6 ，这个算法形成它们非负 6 进制的差 （ :…) 6 。 

S 1 •[初始化]置■()，々—0。 

S 2. [减数字]置 ■(士 - % + 々 ）mod b y k ^ l(uj - Vj + k)jb \ 0 (换言之，依 
据是否出现“借位”，即是否义 - %十々 < 0，把々置成 - 1或0。在的计 
算中，注意我们必然有 - 6 = 0- (6 - 1) + ( - 1)<七-巧 . +々<(6 - 1) -0 
+ 0<6;因此0<屮_ %十々+ 6<26,而这提示了下面要说明的计算机实现 

的方法。） 

S 3 •[对 7 进行循环])加1。现在如果_;<77,则返回步骤 S 2; 否则这个算法终 
止。（当算法终止时，我们应有 

Wi W Q ) 6 时，条件々= - 1出现，这同给定的假定矛盾。见习题12。） ■ 

在实现减法的 MIX 程序中，最方便的是在整个算法中保留值1 +々，而不是々，从 
而可以在步骤 S 2 中计算~ % + (1 +々）+ (6 - 1)。（记住6是字大小。）下面的程 

序将说明这一点。 


程序 S (非负整数的减法） 这一程序同程序 A 类似，但 


\ + k 


的其它程序一样，单元 WM 1 包含常数 


这里，和这节 


即可以存于 MIX 字中的最大值；参见程 


1 


S1. 初始化。 


0 


序 4.2. 3 D ，行38〜39。 


01 


ENN 1 

N 

02 


JOV 

OFLO 

08 

1 H 

J 1 Z 

DONE 

Oh 


ENTA 

1 

05 

2 H 

ADD 

U + N , 

06 


SUB 

V + N , 

07 


ADD 

WM 1 

08 


STA 

W + N ， 

09 


INC 1 

1 

10 


JOV 

IB 

11 


ENTA 

0 

12 


JIN 

2 B 

13 


HLT 

5 


1 确保溢出开关断开 

K + 1 如果 7 =0,则终止 
K 置々—0 

N S2 .减数字 

N 计算七—巧+々+ 6 

N 

N (可以是负 0) 

N S3 .对 j 进行循环。 ；^； + 1 

N 如果溢出则置々—0 

N - K 否则置—1 

N~ K 如果 j<n 返回 S 2 

(出错， i ；〉 w ) ■ 
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这个程序的运行时间是 12 N + 3个周期，它比程序 A 的运行时间稍长些。 
读者可能会问，为什么不值得搞一个综合的加减法程序以代替算法 A 和算法 
S 。 但对计算机程序的考察表明，一般以使用两个不同的程序为好，它使得计算的内 
循环尽可能快地进行，因为这些程序很短。 

下一个问题是乘法，这里我们要把用于算法 A 的思想稍稍向前推进一步。 

算法 M (非负整数的乘法） 给定非负整数 （ i … A WQ ) 6 和 （ ％ - r • ， 

这个算法形成它们的6进制的乘积 + （这个过程通常的纸和笔 

方法是对于0< ; <72，首先形成部分乘积（^^广1 1 ^)/%，而后以适当的比例因 

子把这些乘积加在 一起； 但在计算机中最好是使乘法和加法并发地进行，像在本算 
法中所描述的一 样。） 

Ml •[初始化]把，％- 2 ,…，全部置为0。置0。（如果在这一步 

，…，加0不全清0,则以下的一些步骤将置 

(U^ + 厂广 - —( I…X + ( 切 1"* 加 0)6 

这个更一般的乘和加运算通常是有用的。） 

M 2 .[乘数为 0?] 如果％ =0, 则置叫 + w — 0,并返回步骤 M 6。 （如果■^为0 

的机会相当大，则这个检验可节省大量时间，但它也可以省去而不影响算 
法的正确 性。） 

M 3 •[初始化 i ] 置 0，々— 0。 

M 4 •[乘和加]置 t^—Uj X vj + uuj + ； + 是，然后置 "Wj + t mod b 且 A — Lz ")」 

(这里“进位 4 总是在范围 0< k < b 中，见下面。） 

M 5 .[对2进行循环] Z 加1。现在如果 f <772, 则返回步骤 M 4, 否则置 — 

k o 

M 6 .[对7‘进行循环] 7加1。现在如果72,则返回步骤 M 2,否则这算法终 
止。 ■ 

表1中，假定6 = 10,通过说明在步骤 M 5 和 M 6 开始时的计算状态，解释了算 
法 M 。 关于算法 M 的证明，见习题14的答案。 


表1 914乘以84的乘法 


步骤 

2 

■ 

J 

■ 

v j 

t 

zv 4 

: 1 

加3 




M 5 ' 

0 

0 

4 

4 

16 

• 

• 

m 


■ 

M 5 

1 

0 

1 

4 

05 

■ 

睿 

D 

mM 


M 5 

2 

0 

■■ 

4 

36 

■ 

• 

mm 

5 

■ 

M 6 

3 

0 

• 

4 

36 

m 

3 

6 

5 

6 

M 5 

0 

1 

4 

8 

37 

• 

3 

6 

7 

6 

M 5 

1 

1 

1 

8 

17 

0 

3 

7 

7 

6 

M 5 

2 

1 

9 

8 

76 

4 

mm 

7 

7 

6 

M 6 

3 

1 

• 

8 

76 

7 

6 

7 

7 

6 
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两个不等式 

0<^<6 2 , 0^ k < b (1) 

对于这个算法的有效实现是关键性的，因为它们指出这些计算需要多大的寄存器。 
随着这个算法的进行，这些不等式可以通过归纳法加以证明，因为如果在步骤 M 4 
的开始时有々<6,则我们有 

Uj X Uj + ^i + j + k ^ (6— 1)X(6 _ 1) + (6 _ 1) + (6 _ 1) = ^2 — 1<6 2 。 

下列的 MIX 程序说明了在一台计算机上实施算法 M 时一些必要的考虑。如果我们 
的计算机有一条“乘和加”指令，或者有用来求和的一个双倍长的累加器，则对步骤 
M 4 的编码会稍微简单些。 


程序 M (非负整数的乘法） 这个程序类似于程序 A，rll 


m , rI2 


n , 


rI3 

01 

02 

03 




1 



J 


;,CONTENTS(CARRY) 


k o 


ENT1 

JOV 

STZ 


M - 1 
OFLO 

W , 


1 

i 

M 


Ml . 初始化 
确保溢出开关断开 


^rll 


0 


Ok 

DEC1 

1 

M 

05 

JINN 

* - 2 

M 


对 m > rIlX ) 重复 


06 

ENN2 

N 

1 


07 1H 

LDX 

V + N，2 

N 


08 

JXZ 

8F 

N 


09 

ENN1 

M 

N - 

Z 

10 

ENT3 

N,2 

N - 

Z 

11 

ENTX 

0 

N - 

z 


7^0 

M 2 .乘数为 0吗？ 


若巧=0,则置 


+ 0并转 M 6 


M 3 .初始化 i 。 卜0 

( i + j) 一 j 

是 — 0 


12 2H 

STX 

CARRY 

IS 

LDA 

U 十 M，1 

n 

MUL 

V + N,2 

15 

SLC 

5 

16 

ADD 

W,3 

17 

JNOV 

* + 2 

18 

INCX 

i 

19 

ADD 

CARRY 

20 

JNOV 

* 十 2 

21 

INCX 

1 


( N - Z)M M4 .乘和加 
(N - Z)M 

(N - Z)M rAX— “ ， x% 

( N - Z)M 交换 rAerX 

(N — Z) M 加加 7 . + ^ .到低位一半 

(N-Z)M 出现上溢？ 

K 若然，则进位1到高位那半 

(N-Z)M 加 A 到低位那半 
(N~ Z)M 出现上溢？ 

K 7 若然，则进位1到髙位那半 



STA 

W，3 

23 

工 NCI 

i 

u 

INC3 

i 

25 

JIN 

2B 


(N — Z) M r w t + mod b 

( N - Z)M M 5 .对 i 进行循环 。 + 1 
(N — Z ) M ( z :+ j . ) — (z + j ) + l 
( N - Z)M 若 2 :< m ， 则以 rX = UM 」 返回 M 4 
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26 8 H 

STX 

W + M + N ，2 

N 

27 

INC 2 

1 

N 

28 

J 2 N 

IB 

N 



M6. 对 j 进行 循环 。 + 1 
重复直到 | 


程序 M 的执行时间依赖于被乘数 w 中的位数 M ; 乘数中的位数/ V ;乘数中0 
的个数 Z ; 以及在 f 的计算中，在对乘积的低位那半做加法期间，出现的进位次数 K 

和 / T 。 如果对 K 和尺/取合理的（尽管是稍微悲观的）近似值 j(iV - Z ) M ， 则我们 

求得总的运行时间为 28 MN + 4 M + 10 iV + 3- Z (28 M + 3) 个周期。如果删去步骤 
M 2,则运行时间将是 28 MN + 4 M + 7 N + 3 个周期，所以仅当乘数中0的位置的密 
度为 Z / iV >3/(28 M + 3) 时这个步骤才是有利的。如果乘数完全随机地选择，则预 
料比例 Z / N 约仅为1/6,它是极小的。所以我们结论，步骤 M 2 通常是不值得的，除 
非6很小。 

当 m 和 n 很大时，算法 M 不是进行乘法最快的方式，尽管它有简便的优点。 
4.3.3 小节讨论了一些较快的方法，甚至当 77. = 72 =4时，也有可能比算法 M 乘得 
更快。 

在这一小节所考虑的最后的算法是长除法，其中我们要进行 （m + /2)位的整数 
除以 rz 位整数的除法。这里通常的纸和笔的方法包含有人在进行除法时的某些推 
测和 技巧； 我们必须或者从算法中消除这些猜测，或者要发展某种理论来更仔细地 
说明它们。 

对于通常的长除法过程，人们立即会想到将一般的问题分成一些更简单的步 
骤，每 一 步骤是 （n + 1) 位被除数 a 除以 n 位除数 r 的除法，其中在每 
一步骤之后的余数 r 小于 I ；，所以在随后的步骤中我们使用 A + ( 被除数的下一位) 
作为新的例如，如果要求3142除以53,首先把314除以53得5和余数49;然后 
以53除492,得到9和余数15;于是我们有商数59和余数15。显然，这种想法普遍 
有效，因而对一个适当的除法算法的探索就归纳为下列问题（图 6): 

设 U = ( U n U„ ~ 1 … UlU Q )i^V = ( 卩 ， 2 - 1…幻1 Wo )6 是心 进制下的非负整数，其中 ul 
v < bo 试求一个算法以确定 q = \_ ulv \。 

) Un u n ^ . ■ ■ U\ Uo 

- qv - ► 


图 6 要 求：一 个快速地确定 g 的方式 

我们可能注意到，条件 ulv<b 等价于条件 I ；， 它和 相同； 这 
就是条件（ U n u u -广 • W t ) 6 < ( % — i % _ 2 … t ； o ) 6 。 其次，如果我们写 r = w - ， 则 q 
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是使得^的惟一^整数。 

这个问题的最明显的解决方法，是根据 W 和 t 的最髙位数字，来对 Q 做推测。 
这一方法是否可靠不够明显，但这种算法是值得研究的。因此我们置 



( 2 ) 


这个公式说，$是通过把 w 的两位前导数字除以^的前导数字得到的；而且若结果 
是6或更大，则以 6-1 代替之。 

现在我们研究一个值得注意的事实，即只要 Am 适当大，这个值0总是非常近 
似于所求的答案9。为了分析0怎样接近于心我们首先要说明9绝不会太小。 


定理 A 在上述记号下 

证明由于 g <6- l ， 如果4 = 6-1，则定理肯定是真的。否则我们有§二 
{ u n b + i )/% - 1 」，因此 qv n - 1 ^ u y) b + w „ — — i + l 。 由此得出 



- qv n ^ { b 


n-l 


< 


u n b n + … + wq - (“，力 77 + b n 



4”— 2 十…十 一 ^~ { + 



< v n ^ 1 < V 


因为 u - qv <i v j 我们必有 q^q o I 


现在再证明，在实际情况下 $ 不可能太大于<?，假设$>9 + 3。我们有 




< 


U 


1 


< 


U 


v — b 


n — 



(情况 — 1 是不可能的，因为如果” =(100."0) 6 ，则 q = q 。、 而且，关系<?> 
tO - 1意味着 


3<§ 


一 q < 


U 





b n 


-1 


V 


- b 


n - 1 





因此 



最后，由于6 — = lul v ]^2( v n -i - 1) ，我们有 

了定理 B : 


v ^ { < lbl 2 lo 这就证明 


定理 B 如果 v „ — > Lbl 2]， 则 q -2< q < Q 。 I 

这个定理最重要的部分是:其结论与6无关；不管^怎样大，试验的商0的误差 
绝不大于2。 

条件^<>4/2」非常像一个规格化要求；事实上，它恰是在一台二进制计算 

机上的浮点二进制规格化条件。确保充分大的一个简单方法，是以 
+ 1)」乘“和 w 这不会改变 w / w 的值，也不增加^中的位数，而习题23证明，这总 
是使得的新值充分大。（关于规格化除数的另一个方法，在习题28中讨论。） 
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根据上述事实，我们已有能力来写求长除法的算法。这个算法在步骤 D 3 中对 
q 的选择稍微做了改进，它保证 g = $ 或 0-1; 事实上，这里对§所做的改进了的选 
择几乎总是精确的。 

算法 D (非 负整数的除法） 给定非负整数 W = (“ w + n - t 和 = ( V „ — i 

… ll 1())6 ，其中％ - 1 # 0 且72>1，我们构造6进制的商 LWw 」 = (q rn Q m - 1 L 和 
余数 w mod I ； = （当 n = 1 时，应该使用习题 16 的较简单的算法 。） 

D 1 •[规格化]置 d ^- ibl ( v n -x + 1)」，然后置„-丨… 等于 

(、+ „ — “0)6 乘以 d ;类似地置 （ \ -1 …。0)6等于（％-1…幻1幻0)6 

乘以3。（注意，在 ^ + 左边引进的新数字位置 ^ + w ;如果 d = 1，则在 
这一步所要做的一切就是置0。在一台二进制计算机上，更可取的 
是选择 d %2 的一个乘方，而不用这里所建议 的值； 任何使 ％ M > L 6/2」 的 
d 值都行。见习题37。） 

D 2 •[初始化 j ] 置 j — m 0 (对 j 的循环，即步骤 D 2 到 D 7 ，实际上将是 （ 七+ „… 

u J + lUj ) b 除以（％_广^。） 6 的除法，以得到商的单个数字％;参考图6。） 
D 3. [计算 § ] ® Q ^- l ( uj^ n b + u J + n - { )l v n - J 并令 是余数 （ 〜 + n b + u J + n - i ) 

mod 现在测试是否 Q = b 或机- 2 >於 + w ; + „_ 2 ; 如果是，则 $ 减1， 

f 加上，如果 f <6则重复此测试。（对的这一测试高速度地确定 

试验值 (？ 比 g 大1的大多数情况，且消除$比 g 大2的所有 情况； 见习题 
19,20,21 o ) 

D 4 •[乘和减] VJ , ( u j + n Uj) b - (0% — i … w i ;。）^ 代替 （ ％ + i … 

u ]、 b 。 这个计算（类似于算法 M 的步骤 M 3， M 4 和 M 5) 由一位数的简单乘 

法和一个减法组合而成。数字 （ w ; + 7 ,，~ + ，…，~ ) 应保持 为正； 如果这 

个步骤的结果实际上是负的，则 + + 应保留作为真正值加 

上6” + 1 。即作为真正值的6的补码，并应记住对左边的一个“借位”。 

D 5 .[测试余数]置％ — “如果步骤 D 4 的结果为负，则转向步骤 D 6; 否则转 

向步骤 D 7。 

D 6 •[往回加](如习题21所示，需要这一步的概率很小，仅有 2 M 的阶； 因此当 

进行排错时，促使这一步实施的测试数据应当专门设计。见习题22。）％减 

1，并把加到 （ 力 + „力 + „ -[… + 上。（一个进位将出 

现于~ + „的左边，而它应予忽略，因其同出现于 D 4 中的“借位”相抵消。） 

D 7 •[对 J /进行 循环] j 减1。现在，如果则返回到 D 3。 

D 8 •[不规格化]现在是所求的商，而所求的余数可通过（心-广‘ 

U [ Uo ) b 除以 d 得到 。I 

把算法 D 表示成一个 MIX 程序有若干有趣 之点： 
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t 



图7长除法 

程序 D (非负整数的除法） 对这个程序的约定和程序 A 的类 似； rll = z - 71 

rI2=j > rI3^ z ^ j 0 

001 D1 JOV OFLO 1 Dl . 规格化 


039 

D2 

ENT2 

M 

1 

OJfO 


STZ 

V + N 

i 

OJfl 

D3 

LDA 

U + N ， 2(l:5) 

M+l 


( 见习题 25) 

D2 . 初始化。 j^-m 

为方便 D4 , 置 v 广 0 

D3 .计算 q 


0^2 LDX U + N- 1,2 M+l 

043 DIV V 十 N _ 1 M + l 

ou JOV IF Af 十 1 


rAKr^-u J + J? + u ; + „ 

rA—LrAX/ — ! 」 
如果商 =6 则跳转 


0 厶 5 

0 i 6 

0^7 


STA 

STX 


QHAT 

RHAT 

2F 



M + l 
M + i 

M+l 


0Jf8 1H LDX WM1 



0i9 


LDA 

050 


JMP 

051 

3H 

LDX 

052 


DECX 

053 


LDA 

(M 

4H 

STX 

055 


ADD 


U + N- 1，2 


4F 

QMT E 

1 E 

RW E 

QMT E 

V + N- 1 E 


认一 〜+ ”-!(这里 

+ n _ - 1 ) 

$ 减 1 

相应地调整 f: 
(?—rX 

rAr^t + v n -1 
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056 


JOV 


D4 


E 


(若则 机— 2<作) 


057 


058 


060 


061 


062 

063 


064 

065 D4 


STA 


LDA 


059 2H MUL 


CMPA 


JL 


JG 


CMPX 


JG 


ENTX 


RHAT 

QHAT 


V + N— 2 


RHAT 


D4 


3B 

U + N-2,2 
3B 


E 

E 

M 十 £ 十 1 

M+E + l 


M + E + l 


E 


M 



t 


rA 


测试是否 qv n - 2 < 


tb + 


^ j + 77 - 2 


否则 ，(？ 太大了 
D4 .乘和减 


066 


067 


069 


070 


071 


072 


073 


07 k 

075 


076 


077 


078 


079 


080 


081 


082 


083 D5 


08 Jf 


085 


ENN1 


ENT3 


068 2H STX 


LDAN 


MUL 


SLC 


ADD 


JNOV 


DECX 


ADD 


ADD 


JNOV 


INCX 


STA 


工 NCI 


INC3 


J1NP 


LDA 


STA 


JXP 


086 D6 DEC A 


N 


0,2 


CARRY 


V + N, 
QHAT 


5 


CARRY 


* + 2 


U，3 


WM1 


*+ 2 


U，3 


2B 


QHAT 


Q，2 


D7 


M 



M + l 

(M+ 1)(N+ 1) 
(M+lKN + l) 
(M+1)(N + 1) 


(M + 1)(N 




M 



M 



1) 


(M + 1)(N + 1) 
(M + 1)(N + 1) 
K 

(M + 1)(N + 1) 

(M+ 1)(N + 1) 
(M + 1)(N + 1) 
K / 

(M + 1)(N + 1) 

(M + 1)(N + 1) 
(M+1)(N + 1) 
(M + 1)(N + 1) 


M 


卜 0 

^ + J)—j 


(这里 1 _ 心 < rX ^ + 1) 


rAX^ - qv { 

交换 rA^rX 
加上来自右边数字 
的贡献，加 1 
若和 < _ 6 ，进位 - 1 

加 十』 

力口 6-1 以产生+号 
如无溢岀，则进位 -1 

rX 三进位 + 1 


+ ; 


rA ( 可能是负 0) 


对重复 
D5 . 测试余数 


置％ 


( 这里 rX=0 或 1 ，因％ =0) 
D6 .往回加 
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087 STA Q,2 

088 ENN1 N 

089 ENT3 0,2 

090 1H ENTA 0 

091 2H ADD U，3 

0Q2 ADD V + N,1 

093 STA U,3 

0 % 工 NCI 1 

095 INC3 1 

096 JNOV IB 

097 ENTA 1 

098 J1NP 2B 

099 D7 DEC2 1 

100 J2NN D3 

101 D8 … 

注意步骤 D 3 看起来相当复杂的计算和判定，在机器内部是如何容易地处理的。 
也请注意步骤 D 4 的程序类似于程序 M ， 区别仅在于这里吸收了程序 S 的思想。 

程序 D 的运行时间可以通过考察程序中所示的量 M ， N ， E ， K 和 iT 来加以估 

计（这些量忽略了仅仅以非常小的概率出现的若干情况；例如，我们可以假定行 048 
〜050,063〜064以及步骤 D 6 绝不执行）。这里 M + 1是商所占的字的个数； iV 是 
除数占的字的个数；£是步骤 D 3 中向下调整0的 次数； K 和 IT 是在进行乘法和减 
法循环中所做的某些“进位”调整的次数。如果我们假定 K + iT 近似于 （N + 1 )(M 

+ 1)，而且£：近似于 + M ， 则得到近似于 

30 MN + 30 N + 89 M + 111 

个周期的总运行时间，如果 d > l ， 那就再加上 67 N + 235 M + 4( 习题25和26的程 
序段已经包括在这些总数中）。当 M 和; V 很大时，这仅仅大约比用程序 M 进行商 
与除数相乘的时间多出大约7%。 

当进制6相对地是小的，因此 V 小于计算机的字的大小时，则多精度除法可以 
通过不把中间结果的个别数字减少到[0, 6) 的范围中而加速；请见 D . M . Smith , 
Math . Comp . 65 (1996) ，157 〜 163。关于对算法 D 的评述请见本小节结尾处的一些 

习题。 _ 

有可能通过使用乘法和加法程序校验除法程序等等的结果，来对多精度算术运 
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置 


q 】 


0 


$ - 1 


(i + J)—j 

(这实际上是程序 A ) 


M 



D 7 .对 j 进行循环 


M 



对 



重复 


(见习题 26) 
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算的程序进行排错。下列类型的测试数据有时是有 用的： 

( t m - l )( t n - 1) = + n - t n - t m + 1 

如果 m <72,则这个数有 i 进制展开式 

U - 1 ) … U - 1) (t - 2) {t - 1) ■•- U - 1) 0…0 1 

" -^- / ' - v --- ' ' -V-^ 

位 n _ 7 ?i 位 m - l{lL 

例如， （10 3 - 1)(10 8 - 1) = 99899999001。在程序 D 的情况下，也有必要找出某些测 

试例题，它们使程序的那些很少执行过的部分能得到使用；因为程序的某些部分，即 

使已进行过一百万次随机的测试，也可能总是得不到测试：（见习题22。） 

现在我们已经看到怎样以带符号量的数来进行运算。现在我们来考虑，在使用 

补码记法的计算机上，对于同样的问题应该采用什么方法。对于2的补码和1的补 

码记法，最好是让进制6是字大小的 一半； 于是对于一台字长是32位的计算机，在 

上述算法中我们将使用6 = 2 31 。一个多精度数，除了最高位字之外，所有字的符号位 

全都是0,所以在进行计算机的乘法和除法运算期间不需要进行异常符号校正。事 

实上，补码记法的基本意思是要求我们把除最高位以外所有字认为是非负的。例 

如，采用1个8位的字，则2的补码数 

11011111 1111110 1101011 

(其中符号仅仅对最高位字给出）应当想成是 

- 2 21 + ( 1011111 ) 2 - 2 14 + ( 1111110 ) 2 . 2 7 + ( 1101011) 2 

另一方面，对2的补码记法进行运算的某些二进计算机也提供真正不带符号的 
算术。例如，设^和 y 是32位操作数。 一 台计算机可能把它们当做在 -2 31 < x ，3；< 
2 31 范围中的2的补码的数。如果我们忽略溢出，则32位的和 （: r + y ) mod 2 32 在任 
何一个解释下都是相同的。但当我们改变假定的范围时，溢出在不同情况下岀现。 
如果计算机允许在不带符号的解释下对进位 L(x + 3；)/2 32 」 的容易计算，而且它还提 
供对于不带符号的32位整数的一个完全的64位乘积，则在我们的高精度算法中可 
以使用6 = 2 32 代替6=2 31 。 

当使用补码记法时，带符号数的加法是比较容易的，因为〃位非负整数的加法 
程序可以用于任意”位 整数； 正负号仅出现于头一个字中，所以低位字可以加到一 
起，而不论真正的符号是什么（然而当使用1的补码记法时，对于最左的进位必须予 
以特殊 注意； 它必须被加到最低位字上，而且可能进一步向左传播）。类似地，我们 
发现，带符号数的减法对于补码记法是比较简单的。另一方面，实现乘和除的最简 
单办法看来应通过非负量进行，并且预先做适当的求补操作以确保两个操作数都是 
非负的。通过使用某些在补码记法下直接处理负数的技巧，有可能避免这个求补操 
作，而且也不难看出在双精度乘法中这可以怎样进行；但当要求高精度时，就应该小 
心，不要减慢了子程序的内循环。 

现在我们回过头来分析程序 A 中出现的量 K ， 也就是当把两个”位数相加到 
一起时出现的进位次数。尽管 K 对程序 A 的总运行时间没有影响，但它确实影响 
到与程序 A 相对应的处理补码记法的程序的运行时间，而且对它的分析本身，作为 
生成函数的一个重要应用也是有趣的。 
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假设“和 u 是一致分布于范围0< “， t ；< Y 中的 n 位独立随机整数。设 p nk 备 

在 w 和 I ；的加法中恰有々个进位出现，且这些进位之一出现在最高位（使得 u - Vv > 
Y ) 的概率。类似地，设是恰有々个进位出现，但是在最高位处没有进位的概率。 
于是不难看出，对于所有々和 n ， 


Pok =0， 

Qok — ^0 k ， 


P («+ l )(々 + l ) 


Q(n + l)k ~ 



(3) 


当〜^独立且在。^〜-；!，％-；!;^)的范围内是一致分布的整数时，由于 
(b - 1)/26是〜— 1 + v n -{^b 的概率，而 （6 + 1)/26 是 L + v n ^ x + l^b 的概率， 
故得到上面的结果。 

为了得到关于和的进一步信息，我们可以建立生成函数 


P ( zyt ) = Y ^ jPnk : k t n ， Q ( z ， t ) = S 2^ q nk z k t n (4) 

由 （3) 我们有基本的关系式 ^ ^ 


P ( Z ， t ) 



Q(z yt ) = 1 + t b a'P ( 2 ： ， ， ) 十 b 2 J^ 

这两个方程式很容易对和 QU “） 求解； 而且如果命 

G(z y t) = P(z,t) + Q(z ， t) = ^jG n (z)t n 

* 

其中 g „ u ) 是当 n 位数相加时总进位数的生成函数，贝 i 我们求得 

G(z ,t) = (b - zt)/p(z , t) 


其中 


p ( Zyt )= 


b — 



(1 十 & )(1 + Z)r + 2 ：Z 


2 


(5) 


注意， G ( l ， z ) = 1/(1- r )， 而且这可以用 G „( l ) 必须等于 1( 它是所有可能的概率之 
和）的事实进行校验。求 （5) 对 z 的偏导数，我们得到 


d 2 G 

d Z 2 



现在置2 = 1并展成部分分式 


- zt){b + 1 - zt ) 

2 p ( z ， t ) 2 

t 2 (b - zt)(b + 1- It ) 2 

2 p(z , t ) 3 


y^jG^iDt 

n 



1 

(b - 1)(1 - t ) 


1 

(b - l)(b - t ) 


71 


t 2 I 1 

^1(1 - o 3 


(b — 1) 2 (1 - t ) 



(b - l)(b - 
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由此得出进位的平均数，即 K 的平均值是 


方差是 



1 / 2 n 2 b + 1 26+2 / 1 \ n 

4 _ (b - l ) 2 (b - 1) 2 {^ I 





( 6 ) 


(7) 


所以在这些假定之下进位的数目仅仅稍微小于 

历史和文献 这小节所述经典算法的早期历史，做为一个有趣的课题留给读 
者，这里只追溯它们在计算机上实现的历史。 

D . N . Lehmer 和 J . P . Ballantine 讨论了在台式计算器上乘很大的数时以10” 作 
为给定进制的用法，见 AMM 30 (1923),67 〜69。 

J.von Neumann 和 H . H . Goldstine 在他们的程序设计导论 （ 1947年发表）中首 
先讨论了计算机上的双精度算术 [ J . von Neumann , Collected Works 5, 142 〜 151]。 
上边的定理 A 和 B 是由 D . A . Pope 和 M . L . Stem 给出的 [ G 4 CM 3 (1960)，652 〜 
654] ，他们的论文也包含有关于双精度程序早期工作的文献目录 D A . G . Cox 和 H . 
A . Luther 讨论了关于选择试验商0的其它方法，见 CACM 4 (1961),353 [以+ 

1除而不以％ ^ 除]，另外有 M . L . Stein 也进行了这方面的讨论，见 CACM 7 

(1964),472 〜474[根据\_ 2 的大小，或者除以或者除以^+ 1 ] ; E . V . Kr - 

ishnamurthy[CACM 8(1965) ， 179 〜 181] 指出，在后一方法中单精度余数的考查可导 
致对定理 B 的改进 。 Krishnamunhy 和 Nandi [CACM 10 (1967) ，809〜 813] 提出了 

一 种方法，根据操作数的若干前导数字计算，从而取代算法 D 的规格化和非规格 

化操作。 G . E . Collins 和 D . R . Musser 对 Pope 和 Stein 的算法进行了有趣的分析 
[Information Processing Letters 6 ( 1977 ) ，151 〜155 ] 。 

已经提出关于除法的若干其它 方法： 

1 ) “ 傅里口十[涂 法，， [J . Fourier ， Analyse des Equations Determinees ( Paris : 1831)， 

§2.21]。 这个方法通常在台式计算器上使用，实质上是通过在每一步中增加除数 
和被除数的精度，以得到商的每个新的数字。作者所做的某些颇为广泛的检验表 
明，这个方法肯定是比上述的“除和校正”的技术要差的，但在某些应用中，傅里叶除 
法也可能是实用的。见 D . H . Lehmer，AMM 33 (1926) ，198〜206 ; J • V . Uspensky ， 
Theory of Equations (New York : McGraw - Hill , 1948) ,159 〜164。 

2) 为计算一个数的倒数的“牛顿方法”，广泛用于早期那些还没有单精度除法指 
令的计算机中。其思想是先找出数 1/ r 的某个初始近似值 ： c Q ， 然后令^ + 1 = 2^- 

VX \ 0这个方法迅速收敛到 1/ t 7, 因为 = (1 - d / l ； 意味着 x „ + 1 = (1 - 6 2 )/ t 7。 利 
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用公式 



x n {l + (1 - vx n ) (1 + (1 - vx n ))) 

能够得到三阶的收敛性，即在每一步以 OG 3 ) 代替^而且类似的公式对第四阶的收 
敛性成立， 等等； 见 P . Rabin 0 wit Z ，CACM 4 (1961),98。对于非常大的数的计算，如 
果我们在每一步增加的精度，而且使用 4.3.3 小节的快速乘法程序，则牛顿的二 

阶方法及随后的乘以 w 实际上可以比算法 D 快得多（其细节见算法 4.3.3 R )。 
E . V . Khshnamurthy 讨论了某些有关的迭代方案，见 Trans . 019( 1970) ，227〜 


3) 有些除法方法也以计算 



为基础。见 H . H . Laughlin，AMM 37 (1930),287 〜 293。我们在双精度情况（等式 
4.2.3-(2)) 已使用了这一思想。 

除了刚才所引用的文献外，下列关于多精度算术的早期论文也是有 趣的： A . H . 
Stroud 和 D . Secrest 描述了利用1的补码算术的高精度泮点计算程序 [ Comp . /. 6 
(1963)，62 〜 66]。 B . I , Blum 描述了用于 FORTRAN 程序的扩充精度子程序 
[CACM 8 (1965)318 〜 320] ; M‘Tienari 和 V . Suokonautio 给出 了用于 ALGOL 的扩 

充精度子程序 [ B/T 6 (1966), 332〜338]。 G . E . Collins 利用链接存储分配技术，漂 
亮地描述了不限精度的整数算术 [CACM 9 (1966),578 〜 589]。关于更大得多的运 

算种类，包括对数和三角函数在内，见 R . P . Brent , ACM Trans . Math . Software 4 
(1978)，57 〜 81; D . M . Smith ， ACM Trans . Math . Software 17 (1991)，273 〜 283。 

人类在计算方面的进步传统地以在历史上一个给定的时间里已经知道的 k 的 
十进数字的个数来作为度量。 4.1 节提到了某些早期的 发展； 大约在1719年， 

Thomas Fantet de Lagny 已经把 tt 计算到 127 位 [ MSmoi>es AcacL Sci • ( Paris ，1719) ， 

135 〜 145; — 个印刷错误影响了第 113 位数字]。在发现了一些更好的公式之后， 
1844年来自汉堡的 一 位名叫 Zacharias Dase 的著名心算家只用了少于两个月的时间 
就正确地计算到200 位 [Crelle 27(1844),198]。后来 William Shanks 于 1853年发 

表了 tt 的607位数字，而且继续扩充他的计算直到在1873 年 他得到707位数字。 

[参见 W . Shanks , Confr/bufions to Mathematics ( London ： 1853 ) ; Proc . Royal Soc . 
London 21 (1873)，318 〜 319;22 (1873) ， 45 〜 46 ; J . C . V . Hoffmann , Zeit . fur math , 
und naturwiss . Unterricht 26 (1895) ， 261 〜 264。 ]Shanks 的 707 位的值在很多年里广 

泛为数学文献所引用。但是在1945年 D . F . Ferguscm 注意到它从第528位开始，包 
含好些个错误 [ Math . Gazetfe 30 (1946) ，89〜 90] 。1949年 G‘Reitwiesner 和他的同 
事们利用劳动节周末期间在 ENIAC 上花费了 70小时的计算时间得到2 037个正 


确的数字 [ Math . Tables and Other Aids to Comp . 4 (1950) ， 11 〜 15 ] 。 1958 年，在 
IBM 704上运行 100分钟之后， F . Genuys 达到了 10 000位数字 [ ChY/res 1 (1958) ， 
17 〜 22] ;不久之后 ， D . Shanks (和 William Shanks 无关）和 J . W . Wrench , Jr . 在一台 


• 254 • 


4.3 多精度算术 


IBM 7090上计算8小时，又花费了 4.5 小时进行检查之后，发表了头100 000个数 
字 [ Math , Cbmp . 16 ( 1962)，76〜99 h 他们的检查实际上揭露了一个硬件瞬态错 
误，当计算被重复时它就跑掉了。1973年法国原子能委员会的 Jean Gtulloiid 和 
Martine Bouyer 在一台 CDC 7600上花费了接近24小时的计算机时间之后，计算出 
71 的 100万位数字[见柴日昭彦 （ A . Shibata ) , Surikagaku 20 ( 1982 ) ， 65 〜 73] 。 令人 
欣喜的是 I . J . Matrix 博士在此7年之前就正确地预测，第100万位数字将是“5” 

[Martin Gardner ,New Mathematical Diversions (Simon and Schuster ， 1966 )， 第 8 章 
补遗 ]。 Gregory V . Chudnovsky 和 David V . Chudnovsky ，并且也由金田康正 （ Ya - 
sumasa Kanada ) 和田村良明 （Yoshiaki Tamura ) 独立地在1989年越过了 10亿位数的 

障碍。1991年，在其国产并行计算机上运行250小时之后， Chudnovsky 们把他们的 

计算扩充到20亿位。[见 Richard Preston,Tiie New Yorker 68, 2 (1992 年 3 月 2 
日）， 36 〜 37。 Proc . Nat . Acad . Sci . 86(1989 )，8178 〜 8182 描述了 Chudnovsky 们所 
使用的新公式。]金田康正和高桥大介 （ Daisuke Takahashi ) 使用了两个独立的方法， 
它们分别要求在有1 024个处理单元的日立 SR 2201 计算机上运行 29.0 小时和 
37.1 小时，在1997年7月，得到了超过515亿位数字，它是我们进人新千年的新记 
录。 

在这一小节里，我们已经把我们的讨论限制于用于计算机程序设计的算术技 
术。用于算术运算的硬件实现的许多算法也是很有趣的，但是看来它们不能应用于 

高精度的软件程序；例如，请见 G . W . Reitwiesner，“Binary Arithmetic ”， Advances in 
Computers 1 (New York , Academic Press , 1960) , 231 〜 308; O . L . MacSorley , Pro . 

IRE 49 (1961)，67 〜 91; G . Metze , IRE Trans . EC-11 (1962), 761 - 764; H . L . Gar ¬ 
ner ,"Number Systems and Arithmetic ”， Advances in Computers 6 (New York : Aca ¬ 
demic Press , 1965) ,131 〜 194。 A.Edelman 在 SIAM Review 39 (1997)，54 〜 67 上讨 

论了在 1994 年的奔腾芯片的除法程序中发现的不出名但很有教益的错误。已经有 
人研究了对于硬件的加法和乘法运算所能达到的极大执行时间 [ S . Winograd ， 
JACM 12 (1965) ，277〜285, 14 (1967)， 793-802; R . P . Brent ， IEEE Trans . C-19 
(1970),758 〜 759; R . W . Floyd , FOCS 16 (1975),3-5] 0 也请参见 4.3.3 E 小节。 

习题 

1 ■ [42 ] 通过查阅，比如说，孙子， al - Khwarizmi , al - UqlldisT , 斐波那契和 Robert Recorde 的著 

作，研究对于算术的经典算法的早期历史，并尽可能忠实地把他们的方法翻译成更精确的算法记 
号。 

2 . [ 15 ] 推广算法 A 使它进行“列的加法”，即求； n 个非负的 n 位整数的和（假定 m 

3. [2 J ] 写出习题2中算法的一个 MIX 程序，并估计作为 m 和 n 的函数的运行时间。 

4- [ M 21 ] 利用 1.2.1 小节所说明的归纳论断的方法，给出算法 A 的正确性的一个形式证明。 
5. [21] 箅法 A 从右到左地把两个输人相加，但有时数据更易于从左到右存取。试设计一个 
算法，它产生和算法 A 同样的答案，但它从左到右生成答案的数字，而且如果出现一个进位使得 
以前的一个值不正确，就回过头改变以前的一些值。（注 意：古 代印度和阿拉伯的手稿是以这个方 
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式即从左到右来进行加法的，大概是因为在算盘上习惯于从左到右 工作； 自右到左的加法算法归 
功于 al - UqlTdisi 的改进，也许是因为阿拉伯文是从右到左写的。） 

► 6. [22] 设计一个箅法，它从左到右进行加法（像在习题5中那样），但在答案的数字可能受 
到将来进位影响之前它不存储这个数字 ，一 旦存入，任何答案数字就不再变动了。[提 示： 记住未 
曾存入答案中的相继的6 - 1的个数。]例如，在从磁带上由左到右读和写输人和输出数的情况 
下，或者如果它们出现在一个直接的线性表中时，这类算法是适当的。 

1- IM 26] 习题5的算法中一个进位会迫使回过头改变部分答案的1个数字 U = 1，2,…， 

n )。 试给出该算法发现这种进位的平均次数。（假定两个输人数都是独立的，而且一致分布于0 
与6” -1 之间。） 

8- [ M 26] 写出习题5中算法的一个 MIX 程序，并且如在上文中的计算那样，以预期的进位数 
为基础来确定它的平均运行时间。 

>9. [21] 推广算法 A 以得到一个算法，这个算法把进制为心，^，…（从右到左）的混合进制数 

系中的两个 n 位数相加。因此最低位数字在0与1之间，下一位数字在0和~ - 1之间，等 
等; 参考等式 4. 1-(9)。 

10. [18] 如果交换行06和07的指令，则程序 S 是否能适当地工作？如果交换行05和06的 
指令呢？ 

11. [ M ] 试设计一个算法，它比较进制6的两个非负的 n 位整数“ =(、_广.〜1^) /) 和1 = 

( 1 ••- V 0 ) b 以确定是否 W < V ,U 二 V 或11> V 。 

12. [16] 算法 S 假定了我们知道两个输入操作数中哪个是更大的；如果这个信息未知，我们 
可以不管三七二十一地照样实施减法，我们将发现在这个算法的结尾还存在一个额外的“借 位”。 
试设计另一个算法，它将用来（如果在算法 S 的结尾存在一个“借位”）对进行求 
补并从而得到 U 与 V 之差的绝对值。 

13. [ W ] 写出一个 MIX 程序，它以 W 乘（〜- 1 ..100)6，其中1是单精度的数（即 0< z ;<6)， 
产生出答案问需要多少运行时间？ 

► 14. [ M 22 ] 利用 1.2.1 小节所说明的归纳论断的方法，给出算法 M 的正确性的形式证明（见 
习题 4)。 

15.1 M 20] 如果我们希望构造两个”位小数的乘积 （. 夂 x (. …％) 6 并且仅 

需得到结果的一个”位近似值则可先用算法 M 得到一个位的答案，然后舍 

人成所希望的近似值。但这包含了两倍于合理精度所需要的工作，因为对于 z + + 2,乘积 

u iVj 对答案的贡献非常小。 

如果对于+ 7 >” + 2,在进行乘法时不计算这些乘积而假定它们为0,试给出可能出现 
的极大误差估计。 

► 16. [20] (短除法）试设计一个算法，它把一个非负”位整数 （、- 除以 t ；， 其中 i 
是单精度数（即0<7；<6)，并产生商（叫 ，叫… 和余数 r 。 

17- [ M 20] 在图6的记号下，假定证明如果、=%_ 1 ，则我们必有9 = 6-1或 
b ~ 2 q 

18- [ M 20] 在图6的记号下，证明如果 g^LUA + ^- d / U^i + l )」， 则 q ^ q Q 

► 19. [ M 21 ] 在图 6 的记号下，设 々是对 g 的一个近似值，并命 f =〜々+ w,,_i - 。假设 

%_!>()，试证明如果和„_ 2 >扮+〜,_ 2 ,则 q < q 0 [提 示：通 过考察％的影响来加强定理 A 的 
证明。] 
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20 . [ M 22 ] 利用习题19的记号和假定，证明如果+〜 — 2 ,则々=<?或二$ - 1。 

► 21. [ M 23] 证明如果 ％- 1 > L 6/2」， 而且如果在习题19和习题20的记号下，_ 2 <分+ 
w 7 , _ 2 但々尹^ 7 ，则 w mod v^-(l — 2 / b ) v 0 (后一事件以近似的概率2/6出现，所以当6是一 '个 计算 
机的字大小时，我们在算法 D 中必须有％ = 除非在非常稀少的情况下有所例外。） 

► 22. [24] 利用进制6为10的算法 D ， 试找出一个四位数字除以一个三位数字的例子，对于它 
来说算法 D 中的步骤 D 6 是必要的。 

23. [ M 23] 给定 1；和6是整数，而且 证明总有 L 6/2」<^ L 6 /U + l)]<(v + l)lbl 

( ^ + 1 ) o 

24. [ M 20] 利用 4.2.4 小节中说明的前导数字分布定律，给出算法 D 中 d = l 的概率的一个 
近似公式（当 d = l 时，我们可以省略步骤 D 1 和 D 8 中的大多数计算）。 

25. [26] 写出对于步骤 D 1 的一个 MIX 程序，它对完成程序 D 来说是必需的。 

26 . [21 ] 写出对于步骤 D 8 的一个 MIX 程序，它对完成程序 D 来说是必需的。 

27. [ M 20] 证明算法 D 的步骤 D 8 的开始，未规格化的数 （ w ,, _ !…^ w Q ) A 总是 d 的精确的倍 

数。 

28 . [ M 30 ] ( A . Svoboda , Sfrq/e na Zpracovkn i Informaci 9 ( 1963 ) , 25 ~ 32 ) 设 。 =(i … 

z ^ vqK 是任意进制 6 的整数，其中实施下列操作： 

N 1. 如果％-丨 < 6/2,则以 L (6 + 1)/0，,-! + 1)」乘 r 。 命此步的结果是 

N 2. 如果％ = 0,则置 u —u + (1/6) L 6 U - + 1)」 w 命这个步骤的结果是 

( v n v n 重复步骤 N 2 直到 r ，, t ^ Oo 

试证步骤 N 2 至多被实施三次，而且我们在这个计算的末尾总有 ^ = l,^,_i = 0 o 

[注 ：如果 u 和 u 两者都乘以上述常数，则我们并不改变商 W ⑴的值，而且这个除数已经转换 
成形式（10%_ 2 〜叫.-3八。这种除数形式是非常方便的，因为在箅法 D 的记法下，我们 

可以简单地在步骤 D 3 开始处取々= w , + ，, 作为一个试验的除数，或当 U ; + ,, + 1 ，士 +,,) 二0,0)时取 

々= 6 - 1 o ] 

29 . [ 15 ] 证明或否定：在算法 D 的步骤 D 7 的开始，我们总有 u J+ }t = 0 o 

► 30.[22] 如果存储空间很有限，则在实施这小节的某些算法时，就可能希望对于输人和输出 
两者使用相同的存储单元。在执行算法 A 或 S 时，是否有可能把…，_ 1分别存于与 

…，…，、^或叫，…，％相同的单元？是否有可能让 W ， …，〜，同算法 D 中的，…，〜+⑺占 

有相同的单元？在算法 M 中的输入和输出之间，是否有任何允许的存储单元的重叠？ 

31. [ 28 ] 假设6 = 3，而且 w = (‘ +，,_ i …1^ 0 ) 3 ， r 二 ( % - 1… x ^ o )3 是在平衡的三进制记 

号下的整数（参考 4.1 节），％ 试设计 一 个长除法的算法，它以 r 除 w ， 得到一个绝对值不 

超过 j It ； I 的余数。试找出一个算法，如果把它加到一台平衡的三进制计算机的算术线路中去， 
则它将是有效的。 

32 . [ M 40 ] 假设6 = 2 i ， w 和^是以虚4数系表达的复数。试设计一种算法，它以 r 除《，也 

许得到一个某种适当的余数，并比较它们的效能。 

33 . [ M 40 ] 设计一个取平方根的算法，它类似于算法 D ， 也类似于求平方根的手算方法。 

34. [40] 编出用来对任意整数做四种算术运算的一组计箅机程序，对于整数的大小不附加 
任何限制，只是假定不应超过计算机总的存储容量。（利用链接存储分配，以便在寻找存放结果的 
单元时不浪费时间。） 

35. [ 40 ] 编制出“十倍精度浮点”箅术的一组计算机子程序，利用余量0,进制6，9位浮点数 
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表示，其中 6 是计算机字大小，而且允许用一个全字来作为指数（于是每个浮点数表示成内存中 
的10个字，而且所有的调整都通过移动全字长而不是在这些字之内的移位来进行）。 

36.[ M 25] 只使用多精度加法，减法以及除以小数的除法，给定/的一个适当精确的近似 
值，试说明怎样把 In 4计算到高精度。 

► 37.[20]( E . Salamin ) 说明当 d 是一台二进计算机上的2的次幂时，如何避免算法 D 的规格 
化和非规格化步骤，而无须改变由该算法所计箅的试验商数字的序列。（如果步骤 D 1 的规格化 
没有实行，在步骤 D 3 中如何能计算 $?) 

38. [ M 35] 假设^和 I ；是在范围中的整数。试设计通过进行 OU ) 次加法，减 


法和 U +2) 个二进位的数的比较这些运算来计算几何均值 
用一个“流水线”把乘法和求平方根的经典方法组合在一起。] 


+ 




2 


的一个方法。[提 示：利 


Borwein 和 


通过利用等式 


々>0 





2 

8 ^ + 4 


8^ + 5 


8々+ 


和对于 0 (bg 77) 个二进位的整数进行 0( « log 77) 个算术运算。试说明怎样无须知道前72 _1 个 
二进位就可计算出7：的二进表示的第〃位。（假设 II 的二进数字没有令人惊奇地长的连续的全0 
或全1的长串。） 

40. [ M 24] 当我们知道余数将为零时，我们有时要以^来除说明如果 W 是一个2/7位数 
而 r 是一个;7位数且 w mod P = 0 时，如果我们从左到右地计算一半的商，又从右到左地计算另外 
一半，则我们可以节省算法 D 的大约75%的工作。 

► 41.[ M 26] 高精度算术的许多应用要求重复计算对一个固定 n 位数 W 的取模，其中 w 和基 
数6互素。通过使用由 Peter L . Montgomery 给出的一个技巧 [ Math . Comp . 44 ( 1985 ) ，519〜 

521]，我们可以加速这样的计算。这个技巧通过实质上从右到左地工作而不是从左到右，而使求 
余数的过程流水线化。 


a ) 给定 w = 
说明如何计算 r 


土 


u 


- 1 


Uq ) 


W \ 和—个数加/使得 ivqiv ' mod b = \ y 




土 （ 


v 


1^0 


使得 mod 


mod xv 


b ) 给定 h 位带符号的整数心 ts 切且 Ul 并且像在 a ) 中那样给定 


，说明如何计 


算一 



n 位整数£使得 U I < w 且6、 


uv 


(modulo 


)和 b ) 的算法如何方便模 


算术的实现? 


42. r HM 35 


给定 


和6，令匕,是当 


u 


5 


是6迸制下随机 n 位整数时 


L ( 


+ 


赢蠡蠡 


十 


)/6”」= 々的 概率。（这是习题2的列加法算法中的 


分布。）证明 P 


nk 



0(6 


) ，其中〈^〉是一个欧拉数(参见 5.1.3 小节) 



43. 




8个 


进制的数 u ， 表示分数^255。给定两个这样的分数 u /255 和 W 255, 图形算法通常需要计算它们 


近似的乘积 w /255, 其中加是最接近于_/255的整数。证明 


可以从有效的公式 




uv + 128, 


|_( U /256」 + 0/256」 


得到。 
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M .3.2 模算术 


对于很大的数进行算术运算，可以利用另一个有趣的方案，它是以数论上某些 
简单原理为基础的。这一思想是假定有若干个不含公因子的模7^,7722,…，，并 

且通过“余数” w mod m x ,u mod m 2 ,u mod m r 间接地计算 w ，而不是直接地对 


数 w 进行计算。 

为了记法上的方便，这一小节自始至终都设 


U 


u mod m 


u 2 


u mod m 2 ， 


u r — u mod m r 



借助于除法容易从一个整数 m 计算“ ^心， …，〃 ,），而且——更为重要的是注意到 


—在这个过程中不损失信息，因为假若我们知道^不太大，我们总是可以从“ 1 ， 


，…，〜）重新计算 W 。例如，如果 w < T ；^1000 ，则不可能有 （w mod 7, u mod 

1 1 ， w mod 13) 等于 （mod 7 , v mod 11, v mod 13)。 这是下面所述的“中国剩余定 
理” ¥ 的一个推论。 

因此我们可以认为 （W t …， ) 是整数 w 的 一 种新型的计算机内部表亦，即 


整数 W 的一个“模表示”。 

模表示的优点是，加法、减法和乘法都非常 简单： 

( i ^，...， w r ) + …，= (( Wi + T ^ i ) mod m 1 ，…， ( 、 + v r ) mod m r ) (2) 

( u 1 y u r ) - ( T；i , ) = (( u Y - v l ) mod m x r - y ( u r - v r ) mod m r ) (3) 

( , w r ) X (w = (( ^! X vi ) mod m y ，…， （ u r X v r ) mod m r ) (4) 


例如，为导出 （ 4) 我们需要对于每个模证明 

uv mod nij = (u mod m )) ( r mod m )) mod 

但这是初等数论的一个基本事实：当且仅当 oc = y ( modulo ） 时 ， x mod m } - 

y mod m } ; 而且，如果 xEjc ' 且 : y 三 3 / ， 则 xy^xy (modulo ); 因此 （w mod m } ) 
(v mod rrij ) = uv ( modulo m ]、 。 

模表示的缺点，是我们不能容易地测定（心，…，心）是否大于（^，…， W )。 它也 

难于测定一个加法、减法或乘法的结果是否出现溢出，而且更难于实施除法。当经 
常需要把这样的操作同加法、减法和乘法相联系时，仅当有模表示的快速来回转换 
手段可资利用时，使用模算术才是正当的。因此，模与位置记数法之间的转换是这 
一节中我们所感兴趣的主要课题之一。 

利用（2)， （3) 和 （4) 进行加法、减法和乘法的过程称为剩余算术或模 算术。 可以 
由模算术处理的数的范围等于 777 = m 1 m 2… m r ， 即诸模之乘积；而且当 r ^ n 时如 

果每个％都接近于我们的计算机字的大小，我们可以处理”位的数。因此我们看 

到，利用模算术进行加、减或乘 n 位数字的数所需要的时间，实质上与72成正比（不 


* 即秦九韶定理。——译者注 
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计模表示来回转换的时间）。当考虑加法和减法时，这全然没有好处。但是对于乘 
法，却可能有相当大的好处，因为 4.3.1 小节的通常的方法要求与； z 2 成正比的执行 
时间。 

而且，在一台允许许多运算同时进行的计算机上，模算术甚至对于加法和减法 
都可以有相当重要的 优点； 相对于不同模数的运箅可以同时完成，所以我们在速度 
方面就得到了实质性的提高。而通过上一节中所讨论的通常技术，却不可能实现这 
类减少执行时间的效果，因为必须考虑到进位的传播。也许在某一天高度并行的计 
算机将使得同时操作非常普遍，以致当需要对一个要求高精度的问题迅速给出答案 
时，模算术在“实时”计算方面将具有巨大的重要性。（对于高度并行的计算机，通常 
更喜欢同时运行々 个独立 的程序，而不是以々倍的速度运行一单个程序，因为后一 
种情况是更复杂的，也不能更有效地利用机器。“实时”计算却属例外，这使得模算 
术固有的并行性更有意义。） 

现在我们来考察奠定数的模表示基础的基本 事实： 

定理 C (中国剩余定理）设 m :， m 2 ，…， m, 是两两互素的正整数，即 

丄 ” U 当 j # 々时 （5) 

设 m 二 m'mf m r ，并设 a ， u \，…， u r 是整数。于是恰有 一 个整数 u ，它满足条 

件 

a < u < a m ， 及 u = u } ( modulo m } ) , 对于 1 < j < r (6) 

证明如果对于 j , u = v ( modulo ，则对于所有 j 、 u _ v 是 my 的倍 

数，所以 （5) 意味着 w _ I ； 是 777 = m 2 '' m m r 的倍数。这证明了 （6) 至多有 一 个解， 

为完成证明，我们还须证明至少有一个解，而这可以用两个简单方法 得出： 

方法 1(“ 非构造性”证明）当 W 跑遍 m 个不同值< a + m 时， r 元组 
(u mod m j ,--*, w mod 必然也跑遍 m 个不同的值，因为 （6) 至多有 一 个解。但恰 

巧有 m ' m 2 ." m r 种可能的 r 元组（％，…，％)使得 0< Vj < m j 0 因此每个 r 元组必定 

恰出现一次，而且必然有 m 的某值使 （w mod m x ，•- - y u mod m r ) = ( ui ，…， u r ) 。 

方法 2(“ 构造性”的证明）我们可以找数使得 

Mj = 1 (modulo jtLj ) 和 Mj = 0 (modulo m k ) 对于々 # j (7) 

这是由于 （5) 意味着％ 与 mlnij 互素而得岀的，所以通过欧拉定理（习题 1.2.4-28) 
可以取 

Mj = (ml (8) 

现在数 

w = a + ((u[M[ + u 2 Mi 十…十 u r M r - a) mod m ) (9) 

满足 （6) 的所有条件。 ■ 

中国数学家孙子指出了这一定理的一个非常特殊的情况，他给出了一个称为 
“ 太元”（“大大推广”）的规则，他写作的日期很难确定，一般认为是在公元280和473 
年之间。中世纪印度的数学家通过他们的古塔卡 （ Kmtaka ) 方法（请见 4.5.2 小 
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节），进一步发展了这些技术。但是是秦九韶在他的《九章算术》 （1247) 中第一个表 
述了该定理并以适当的一般性证明了它。后一工作也考虑了像在习题3那样诸模 

有公因子的情况。[参见 J. Needham,Science and Civilization in China 3 (Cambridge 


University Press, 1959),33 




34,119 




120; 李俨 （Y.U) 和杜石然 （S.Du)， Chinese 


Mathematics (Oxford : Clarendon, 1987 )，92 


94,105,161 




166 ; 沈康身 (K. Shen) 


Archive for History of Exact Sciences 38 (1988)，285 〜 305 。]关于这个理论的许多早 
期的贡献已经由 L. E. Dickson 做 了概述 [History of the Theory of Numbers 2 
(Carnegie Inst, of Washington, 1920 ， 57 〜 64] 0 

作为定理 C 的一个推论，我们可以在任何相继的 m = m x m r -m r 个整数的区 
间中，使用数的模表示。例如，我们可以在 （6) 中取 a =0,而且仅仅处理小于 m 的 


作为定理 C 的一个推论，我们可以在任何相继的 m = m x m r -m r 个整数的区 

间中，使用数的模表示。例如，我们可以在 （6) 中取 a =0,而且仅仅处理小于 m 的 
非负整数。另一方面，当做加法和减法时，和做乘法一样，通常最方便的是假定所有 


模数 


m ! , 77Z 2 



r 都是奇数，使得 


■ ■暴 


m r 也是奇数，这样可以处理范围 



2 


< 


u 


< 



2 


( 10 ) 


中的整数，这一范围关于0是完全对称的。 


为了实施在(2)， （3) 和 （4) 中引岀的基本操作，当0< 




< 



,时，我们需要计 


算( 





mod 





mod ntj 以及 UjVj mod 



o 如果是一个单精度的 


数，则通过先做一个乘法再做一个除法运算，来形成 mod 



,是最方便的。对于 


加法和减法，情况更简单些，因为不需要做 除法； 可以方便地使用下列公式: 





mod 




+ 






Vj ^ 



■ 

f J 




mod 



u 





< 



(参考 3.2.1.1 小节。）。由于我们要 m 尽可能大，最容易的是命 



( 11 ) 

( 12 ) 

为一个计算机 


字所能容纳的最大奇数，命 m 2 为与互素的小于 



的最大奇数，命是与 



和 



两者皆互素的小于 


7719 


的最大奇数，如此等等，直至找到足够的 



,来给 


出所希望的范围 
法。 



0 


4.5.2 小节讨论了为确定两个整数是否互素的一些有效的方 


作为一个简单的例子，假设我们有字长仅为两位数的十进计算机，所以字的大 


小为100。则上一段所述过程将给出 



99 , 7712 


97， m3 


95, m 4 — 91, m 5 


89, 



83 


(13) 


等等 


在二进计算机上，有时希望以一种不同的方式来选择 



，，即选择 


771 


2 € j - 1 


(14) 


换言之，每个模数比2的一个乘方小1。772,的这样一 3 

算更为简单，因为像在1的补码算术中那样，对模 A 
当按照这个策略来选定模数时，稍微放松条件 

要求 


,的这样一种选择，通常使得基本算术运 


的补码算术中那样，对模 - 1 进行运算是比较容易的。 
^数时，稍微放松条件0< W , | 是有帮助的，这样我们仅 
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0 ^ < 2 e j , Uj 三 u (modulo 25 — 1) (15) 

于是，也允许值屮=%=2^-1作为代替义=0的另一个可供选用的方案，因为这 
不影响定理 C 的正确性，而且它意味 着％. 可以是任意的~位二进数。在这一假定 
之下，模％的加法和乘法运算就 变成： 

〜㊉ ％ = (( Uj + Vj ) mod 2 e j ) + [ Uj + Vj ^ 2 e j ] (16) 

u j ® v j 二 (UjVj mod 2 e j ) ㊉ 〜」 (17) 

(这里的 ㊉ 和 ㊈ 指的是，当利用 （15) 的约定进行加法和乘法时，对于 （ Wl ，…，^)和 
(^，…，％)的个别分量分别要做的运算。）等式 （12) 对于减法仍然有效，或者我们可 
以用 

% ㊀ Vj = (( u ) - vj mod 2 e j ) - I Uj < Vj~\ (18) 

即使当大于计算机字长时，这些运算仍可有效地 进行； 因为计算一个正数模 2 的 

某次幂的余数，或者除一个数的2的次幂，是一件容易的事情。在 （17) 中，像在习题 
3.2.1.1-8 中所讨论的那样，我们有乘积的“高半部”和“低半部”的和。 

如果使用形如25 - 1的模，则我们必须知道在什么条件下数 - 1与2/ - 1互 
素。幸而，有一个非常简单的规则 

gcd (2 e - 1，2’ - 1) = 2 gcdU ，’〉- 1 (19) 

它特别指岀，当且仅当 e 和/互素时， 2 e - 1与 2/- 1互素。等式 （19) 是由欧几里得 
算法和等式 

(2 e - 1) mod (2 f - 1) = 2 emodf - I (20) 

得出的（见习题6)。在字长为2 32 的一台计算机上，我们因而就可以选择比如说 
讲 1 = 2 32 _ 1 ， m 2 = 2 31 — 1 ， w 3 = 2 29 — 1 ， m 4 = 2 27 — 1 ， m 5 = 2 25 _ 1;这将允许我们有 

效地进行在大小为范围内整数的加法、减法和乘法。 

我们已经发现，模表示的来回转换运算是非常重要的。如果我们给出一数^ 
则简单地通过以来除^并保存余数，就可以得到它的模表示（&，…， 

、）。如果 u — ，则一个可能更有吸引力的过程是利用模算术计算 

多项式 

十 v m - x )b + --)b + v 0 

的值。当6二2且当模％有特殊形式 2^-1 时，这两个方法都归结为一个十分简 
单的过 程：考 虑把有~位的块组合在一起形成的 w 的二进表示 

u = a t A L + h — 十 ■•• + 十 ao (21) 

其中 A =2% 而且对于于是 

u 三 a , 十 ！ 十 ... + a ! 十 a 0 (modulo 2 e i _ 1) (22) 

因为 A ^ l ， 因此我们可以利用 （16) 把诸 ~ 位的数 相加： ^ ㊉ … ㊉ ^ ㊉ 以，得到％。 

这一过程类似于熟知的“舍9法”操作，该法在以十进数表示 u 时用来确定 W mod 9。 

从模表示转换成位置记数表示要稍微困难些。在这方面，注意一下计算的研究 
如何改变我们对于数学证明的观点，是有趣的 ：定理 C 告诉我们，从 Ui ，…， &) 转 
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换成^是可能的，而且给出了两个证明。我们所考虑的头一个证明是经典的，它仅 

仅依赖于一些非常简单的概念，即以下的 事实： 

i ) 任何是的倍数的数，当诸％两两互素时，必是 m x m 2 … m T 

的倍数； 

ii ) 如果 m 只鸽子放入 m 个鸽巢当中而且没有两只鸽子同在一个鸽巢中，则在 
每个鸽巢中必然有一只鸽子。 

按照数学的美学传统思想，这毫无疑问是定理 C 的最漂亮的 证明； 但从计算观 
点看，它是毫无价值的！这等于说，“试验〃 = a ， a + 1 ，…直到你发现一个值，使得 

u ^ ui ( modulo m i ) , y u = u r ( modulo ? n r ) 。” 

定理 C 的第二个证明是更为明 显的； 它说明怎样计算 r 个新的常数，…， 

JV ^， 并且借助于这些常数通过公式 （9) 而得到解。这个证明使用了更复杂的一些概 

念（例如，欧拉定理），但从计算的观点来看，它是更为令人满意的，因为常数，…， 

M r 仅仅需要确定一次。另一方面，通过等式 （ 8 ) 确定肯定不是轻而易举的，因 

为一般说来，欧拉^函数的计算要求把 M , 分解成素因子的乘方。比起使用（ 8 )，有 

好得多的方法来计算 M ; 。 在这方面我们可以再次看到数学的优美性和计算的有效 

性之间的区别。但即使我们通过最好的方法来求，我们仍然受阻于这样一个事 

实， g 卩 iVT ; 是巨大的数772/7^的一个倍数。因此， （9) 迫使我们进行大量高精度的计 

算，而这样的计算恰恰是我们首先希望通过模算术来加以避免的。 

所以，如果打算有一个从 Ui ， …，〜）变换成“的真正能用的方法，我们需要有 

定理 C 的甚至 更好的 证明。这样的方法是 H . L . Gamer 于1958年提出 的； 它可以利 


用对于 



个常数 q 进行，其中 


cijmi 三 1 (modulo mj ) 


(23) 


用欧几里得算法容易计算这些常数，因为对于任何给定的 z 和 7 ,算法 4.5.2 X 确定 
a 和 6 ，使得 am , + 6m , = gcd ( ) = 1 ，而且我们可以取 c 2; = a 。当模有特殊形式 


2 ^- 1 时，习题 6 中给出了确定~的一个简单方法。 


一 旦确定了满足 （23) 的我们即可置 


V\ Ui mod m\ 

— ( “2 _ r 1 ) c 、12 mod 7712 

— (( ^3 - V \ ) <：!3 - v 2 ) C2z mod 

« 

I 

麄 

tv — (••■((〜— v l ) c lr - V 2 )c 2r -…- ^ r _! ) c (r _ 1)r mod m r 


(24) 


于是 


U = 7^ r m r —i 7722 w 1 十， •• + V 2,771 I + t； 2 ^l + ^1 


(25) 


是满足条件 

0 < u < m ， u = modulo 对于 1 < j < r (26) 
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的数。（见习题8;习题7给出了不包含这样多的辅助常数的重写 （24) 的另一个方 
法。）等式 （25) 是 w 的一个混合进制表示。利用 4.4 节的方法它可以换成二进或十 
进的记号。如果 0< w < m 不是所希望的范围，则在转换过程之后，可以增加或减去 
m 的一个适当倍数。 

(24) 中所示的计算的优点是％的计算可以仅使用算术模％来完成，它已经构 
造到模算术的算法之中。而且， （24) 允许并行的计算 ：我们 可以由 
(ui mod ttly ， …， u r mod m r ) 开始，然后在 1 r 的时间 j ，对于 j r 同时置 
v k ^-{v k - Vj)c jk mod m k0 A . S . Fraenkel 讨论 / 计算混合进制表不，并允许类似并 
行性可能性的另一种方法，见 Proc . ACM iVarConf . 19 ( Philadelphia ： 1964) , El . 4 0 

重要的是注意混合进制表示 （25) 足以用来比较两个模数的量。因为如果我们 
知道和0^ < m ，则通过首先转换成 （ ^，…， XV )和 （ <，…， O ，然后按 

照字典序测试是否，或者是否 v r = i / r 且％-等等，就可以知道是否 
W < t /。 如果我们仅仅想要知道（^，…，〜）是否小于（<，…，<)，那就不必把所有 
的数都转换成二进或十进记号。 

比较两个数，或者判定一个模数是否为负的操作，在直观上是非常简单的，所以 
我们希望有比转换成混合进制更为容易的方法来进行测试。但是下列定理表明，找 
到一个好得多的方法希望甚小，因为一个模数的范围实质上还依赖于所有剩余（^， 

… ，^) 的所有位。 


定理 S ( NichdasS Z ab 6，1961) 借助于上面的记号，假定7?^< ， 并设 L 是范 

围 

^ L ^ m - m x (27) 

中的任何值，设 g 是使得集合 I g (0) , g ( l ) , *** , g ( m J - 1)\ 包含少于个值的任何 
函数，则有数 u 和 v 使得 

g(u mod 7/2 1 ) = g(v mod mi ) ,u mod mj = v mod mj 2 ^ j ^ r 

(28) 

(29) 

证明由假定，必然存在 U 关 V 满足（28)，因为 g 必须对两个不同的剩余取相 
同的值。设 （ w ， p ) 是 w 的满足 （28) 的 一 对值，其中 w 是 一 个极小值。 
由于 w = w _ /^和 v — v ~ rri \ 也满足 （28), 所以由 w 的极小性必有 u ' 〈 0 。因此 

U < 772 | ^ L ;而且如果 （ 29 ) 不成立，则我们必有 v 〈 L 0 但是，而且 p - w 是 

m : … m r = ml m \ 的倍数，所以 v^v - u^-mj > m lQ 因此如果 （29) 对于 （w ， tO 

不成立，则对于数偶 （ W 〃，+ 772!)将成立。 ■ 

当然，代替7^，对任何％都可以证明一个类似的 结果； 而且也可以以条件 

U a < u<a + L <. v<a + m ” 代替 (29) ， 只须在证明过程中做一些小的改变即可。因 
此，定理 S 表明，许多简单的函数不可能用来确定一个模数的范围。 
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现在重复这一小节中所讨论的主要论点：模算术对于一些应用可能有相当大的 
，在这样一些应用中，居支配地位的计算涉及同加法和减法相结合的大整数的 
精确乘法（或乘方），但很少需要除法或数的比较，或者测试中间结果是否“溢出”范 
围。（重要的是不要忘记后一个限制；对于测试溢出，有些方法可以利用，如同在习 
题12中那样，但是一般说来它们都如此之复杂，以致把模算术的优点化为乌有。) 
H.T— 和 Y. Ishibashi 讨论了关于模计算的若干应用，见 Womadon Proc. 

Japan 1 (1961) ，28〜42。 


m 


这种应用的一个例子是有理系数线性方程组的精确解。由于种种原因，在这种 


情况下最好假定模数 




2 


m 


r 


都是 素数； 这些线性方程可以独立地模每个 



来求解。 l.Borosh 和 A.S.Fmenkel 给出了这个过程的详细讨论 [Math. Comp 


(1966) 




而且由 A. S. Fraenkel 和 D. Loewenthal 做了进一步的改进 



Res. National Bureau of Standards 75B (1971) ， 67 




75] 


O 


借助于他们的方法，在 


台 CDC 1604计算机上，用了不到20分钟的运行时间就精确地求得了有120个未 
知数的111个联立线性方程组的9个独立解。当系数矩阵是病态时，同样的过程对 
于解浮点系数的联立线性方程组也不无价值。模技术（把给定的浮点系数当做精确 
的有理数）给出了求得真正答案的方法，而这个方法所需要的时间比其它已知能产 
生可靠近似答案的方法都要少！[关于这个方法的进一步发展，见 M.T. McClellan, 
JACM 20 (1973) ，563〜588;关于它的局限性讨论，亦见 E. H. Bareiss,J. Inst. Math. 


(1972),68-104 


o 


涉及模算术的公开的著作大多数是面向硬件设计的，因为模算术的无进位性质 
从高速运算的观点来看是有吸引力的。这一思想首先是 A.Svoboda 和 M.Valach 在 

捷克斯洛伐克杂志 Stroje na Zpraco 
Machines ) 3 (1955),247 




(1959),140 〜 147] 


o 


^ani Informaci (Information Processing 

上发表的；而后 H.L. Garner 独立地提出了它 [ 

A. S. Fraenkel 提议使用形如 _ 1 的模数 [JACM 


(1961),87 




Schonhage 揭 7K 了使用这样的模数的右千优点 [Computing 



(1%6)，182〜196]。关于这个课题的另外的信息和一个广泛的文献目录，见 N.S. 

Szab6 和 R. I. Tanaka 的著作 Eesic/ue Arithmetic and its Applications to Computer 
Technology (New York : McGraw-Hill, 1967) 0 1968 年由 I. Y ‘ Akushsky 和 D. I• Yu- 

ditsky 所著的一本俄文书中，包括有关于复数模的一章[参考 Rcv - Roumaine de 


Math. Pures et Appl. 15 (1970) 




160] 


关于模算术的进一步讨论可以在 4.3.3B 小节中找到。 


The notice-board had said he was in Room 423 ， 

but the numbering system,nominally consecutive ， 
seemed to have been applied on a plan that could only 
have been the work of a lunatic or a mathematician 

通知栏上说他在 423 号房间， 
但是这个名义上连续的计数系统， 
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似乎一直用于只可能是一个疯子或数学家所做的一个计划上。 

— ROBERT BARNARD , The Case of the Missing Bronte (1983) 

习题 

\ .[20 ] 求满足条件 m mod 1 - l ,u mod 11 = 6 , m mod 13 = 5 ，且 (X w < 1000 的所有整数 w 。 
2.[ M 20] 如果允许〜〜，〜，…，、和“是任意实数（不仅仅是整数），则定理 C 是否仍成 

立？ 

► 3. [ M 26] (广义中国剩余定理）设 yrn r 是整数， w 是…，队的最小公倍 
数，并设 a ， w 1 ， w 2 , …，、是任意整数，假定 

Uj = Uj (modulo gcd ( m 2 . ， )) ， 1 ^ z < j ^ r 

证明恰有一个整数 w . 满足条件 

a < u < a + m ， u 三 u } (mod u lo ) , 1 ^ j ^ r 

而且当前边的条件不成立时，不可能有这样的整数 

4. [20 ] 继续 （13) 中所示的过程，771 7 ,7^ 8 ，/?2 9 ，一将是什么？ 

► 5.[ M 23] 假设 （13) 的方法已继续进行到不能选择更多的⑺；了，这个“贪婪的”方法是否给 
出最大可达到的值 m 〗…，使得 m ; _ 都是小于100的而且都是两两互素的奇正整数？ 

6‘[ M 22] 设■是非负整数。 

a ) 证明当且仅当 e 三 f (modulo g ) 时，2〃 - 1 ) 。 

b ) 给定 e mod f ~ d 和 ce mod / — 1 ，证明 fjS 等式 

((1 + + … + 2 ( c -⑸） •（2 e - 1)) mod (2’ -1) = 1 

(于是，对于如同 （23) 中所要求的 Z - l 的模 2/-1 逆，我们有了一个比较简单的公式。） 

► 7.[ M 2 i ] 证明 （24) 可重写 如下： 

Vi Uy mod 772 1 

v 2 一 ( u2 ^ ^[)^12 mod m 2 

v 2 («3 - (^1 + ^ 2 )) C 13^23 mod m 3 

■ 

M 

♦ 

u r — ( u r - ( ^1 + m l ( v 2 + m 2 ( ^3 + + m r - 2 r r -i ) … ))) c lr ... r _ 1)r mod m r 

如果以这种方式重写这些公式，则仅仅需要 r - 1个常数 C ; = q ; … c G _ 1); mod my 而不是像在 
(24) 中那样需要 r ( r - l )/2 个常数 c /; 。 试从计算机计算的观点着眼，讨论这种形式的公式相对 

于 (24) 的优点。 

5 . [ M 21] 证明由 （24) 和 （25) 所定义的数《满足(26)。 

9. [ M 20] 说明如何只使用模⑺，算术 计算屮 的值，就从混合进制记法 （25) 的值巧，…，％返 
回到原来的剩余，…，〜。 

10. [ M 25 ] 处于对称范围 （10) 中的一个整数 w ，可以通过求出数〜，…， w r 来表示，其中 w = 

% (modulo %. ) 而且 _ % /2 〈士 < % /2 ， 而不是像在正文中那样坚持 0 < 屮 < 。 试讨论这样的 

模算术过程，在同这样的对称表示相关联时，它们将是适用的（包括转换过程(24))。 

11. [M23] 假设所有的％都是奇数，而且已知 u = ( Wl ，…， 〜） 是偶数，其中 0<“< 州。试 

求一个使用模算术来计算 W 2 的相当快的方法。 

12. [ M 10] 证明，如果 0<^，1；<771，则当且仅当和数小于 “时， u 和^的模加法引起溢出 
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(即超出由模的表示所允许的范围之外）。（这样，溢出的检测问题就等价于比较问题。） 

► 13.[M25] (自 守 的数） 一个72位十进数 __r>l 被“娱乐”数学家称为“自守的”，如果: c 2 的最后 
n 个数字等于 x。 例如，9376是一个4位的自守数，因为9376 2 = 87909376。[见 Sc/entAc 

can 218 (1968 年 1 月 ) ,125 0 ] 

a) 证明当且仅当分别地有 mod 5” = 0或1，以及： c mod 2” = 1或0时，一个位数 z >1是自 
守的（于是，如果 m { = 2 n 和饥 2 = 5'则仅有的两个^/位自守数是 （7) 中的数 iW, 和 iVT 2 )。 

b) 证明如果 i 是 n 位自守的，则 （3：c 2 - 2i 3 ) mod 10 2 ”是位自守的。 

c) 给定 cx = \ (modulo : y)， 试求依赖于 c 和: c 但不依赖于: y， 且满足 c x 2 = \ (modulo jy 2 ) 的〆 
的简单公式。 

► 14 . [ M 30 ] (梅森乘法） （:?:。，：^，…-。和^。，3^，…，: Vr!) 的循环卷积定义为 （2： o ,2： 2 , …， 

，其中 

Z k - x jyj , 对于0 < 々 < ” 

i + j 三 k (modulo n ) 

在 4.4.3 和 4.6.4 小节中我们将研究实现循环卷积的有效算法。 

考虑以下列形式表示的 g 个二进位的整数 U 和 

^ = 0 是二0 

其中 0<%，％<2 lu + 1) ^」4_」。 （这个表示是进制 2 U/ ”」和 2「 g/w1 的混合。）使用一个适当的循 
环卷积，提出一个求 

w = ( uv ) mod ( 2 q - 1) 

的表示的好方法[提 示： 不要怕浮点算术]。 

"4.3.3 乘法能有多快？ 

在定位计数系统中，乘法的通常方法（即算法 4.3.1 M )， 把一个 m 位数字的数 
乘以一个 n 位数字的数需要近似于 cwn 个运算，其中 c 是一个常数。在这一小节 
中，为方便起见，我们假定 m = n ， 并且考虑下列问题 :每个 通用的做两个 n 位数字 
乘法的计算机算法，当 n 增大时，是否总要求同 n 2 成正比的执行时间? 

(在这个问题中，“通用的”算法指的是这样一个算法，它接受定位计数法下的数 
n 和两个任意的 n 位数作为输入，而它输岀定位计数法下两个数的乘积。肯定地 
说，如果允许对〃的每个值选择不同的算法，则这个问题就没有什么兴趣了，因为乘 
法可对任何确定的 n 值以对某张大表的“查表操作”来进行。 “ 计算机算法”这一术 
语指的是一个这样的算法，它宜于在一台数字计算机(例如 MIX) 上实现，而且执行时 
间是在这样 一 台计算机上来实施该算法所需的时间。） 

A . 数字方法 令人有些惊异的是对于上述问题的答案竟是“否”。事实上，不难 
看出这究竟是为什么。为方便起见，在这一节内始终假定，我们处理的是表示成二 
进制记号的整数。如果有两个位数字 W =( W 2 „-1 … ^1^)2 和… 

^^) 2 ,则我们可以写 

u = 2 n U x + U 0 , V = 2 ?, V! + V 0 (1) 
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其中 [Ji = (t/2„-r"S)2 是 W 的“高位那一^半”，而 Uo = (〜— 是低位那 
—^半”；而且类似地， Vi = (Wn-r" 1 ^)〗， Vq = (%-广‘*^())2。现在我们有 

uv = (l 2n -^- 2 n )U l V l + 2 n (Ui - U 0 )( V 0 - V { ) + (2 n + 1)U 0 V 0 (2) 

这个公式把 2” 位数乘法的问题归结为 n 位数的三个乘法，即 U . V . AU , - U 0 )* 
( v 0 - V :)和 U Q V Q ， 加上某些简单的移位和加法运算。 

当想要得到四倍精度的结果时，公式 （2) 可用于双精度乘法，而且它只比在许多 
机器上用的传统方法稍快一点。但是公式 （2) 的主要优点在于我们可以使用它来定 
义乘法的递归过程，当”很大时，这个过程要比熟知的？阶方法快得多：如果 
丁（?7)是为实施 n 位数的乘法所需要的时间，则对于某个常数 c 我们有 

T(2n) < 3T(n) + cn (3) 

因为 （2) 的右边仅仅使用三个乘法加上某些加法和移位。按归纳法，关系式 （3) 意味 
着，如果我们把 c 选择得充分大，使得如下不等式当々=1时成立，则 

T(2 k )<M3 k -2 k )， k > 1 ⑷ 


由此我们有 

T ( n ) < T (2 rigw1 ) < c (3「 lgri1 - 2 rign1 ) < 

3 c • 3 lg ^ = 3 c ?2 lg3 (5) 

关系式 （5) 说明，乘法的运算时间可以从 ” 2 阶减少到 /2 lg3 〜 rz 1585 的阶，所以当”很 

大时，递归方法要比传统方法快得多。习题18讨论这个方法的一个实现。 

(以阶 n lg3 的运行时间来进行乘法的一种类似的但更为复杂的方法，看来首先 

是由 A.Karatsuba 提出的 [ DoidadyAkad.Nauk SSSR 145 ( 1%2)，293〜294;英译见 

Soviet Physics-Doklady 7 (1963) ，595〜 596] 。奇怪的是，这个思想在1962年以前似 
乎未被发现；还没有报道过任何一位用心算乘很大的数而闻名于世的“计算天才”曾 
使用过这类方法，尽管把公式 （2) 改为十进记号似乎可导致用心算乘8位数的一个 

相当容易的方法。） _ 

如果我们注意到刚才所使用的方法实际上是一个更为一般的方法在， =1 时的 

特例，则对于任何固定的 r ， 用这个一般的方法可推出 

T"((r + l ) r2 )<( 2r + l ) T (72) + oi ( 6 ) 

在 n 趋于无穷时，运行时间还能进一步减少。这个更为一般的方法是：设 

U - …以 iW 0 )2 和 V 二 (幻（,+ 1) 7? -：1 …幻 1幻0)2 


被分成 r + 1个片段 

U 二 十…十 U x 2 n 十 L / 0 ， V = + …+ + v 0 (7) 

其中每个 U ; 和每个％都是一个72位数。考虑多项式 

U(x) ~ 十 …+ 十 Uq , V(x) — V〆” + …+ V\：c + V" 0 (8) 


并命 

W(x) = U(x)V(x) = + … + Wp 十 W 0 (9) 

由于 U ( Y ) 和 V (2 n )， 我们有⑽二 W (2”）， 所以如果我们已知 WU ) 的系 
数，则就能容易地计算问题是要找一个仅需 2 r + l 个 72 位数的乘法，加上某些 
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执行时间只同 n 成比例的其它运算，即可计算 W ( x ) 的系数的好方法。这个方法 
可以通过计算 

U (0) v (0) = W (0) } U ( l ) V ( l ) = W ( l ) r -, U (2 r ) V (2 r ) = W (2 r ) (10) 

来完成。一个 2 r 次多项式的系数可以写成该多项式在 2 r + l 个不同点处的值的线 
性 组合； 这样一个线性组合至多要求同^成比例的执行时间。（实际上，乘积 L /( j > 
V ( J ) 严格说并不是72位数的乘积，但它们都是至多〃 +〖位数的乘积，其中/是依 
赖于 r 的一个固定值。容易设计 n + Z 位数的一个乘法程序，它仅要求 + 

次运算，其中 T ( n ) 是 n 位乘法需要的运算次数，因为〖位乘以72位数的两个乘积， 
当/固定时，可以在个运算中完成。）因此我们得到一个满足 （6) 的乘法方法。 

如果像在推导 （5) 中那样论证，关系式 （6) 意味着 T ( n )< c , n ^ r + ^ + ^< 

qr 2 1+1 ° g m 2 ; 所以我们现在已经证明了下面的 结果： 

定理 A 给定 ( ->0, 对于一个与 n 无关的常数 山) ，存在一个乘法算法，使得为 

乘两个 n 位数所需要的初等运算的次数 T ( n 丫 满足 

T ( n ) < c (^) ? i 1 + ( I (11) 

这一定理仍然不是我们寻求的最终结果。它对于实用说来，是不能令人满意 
的，这是因为当 ^-0 时（因此，当〜时），这个方法变得极其复杂，它引起 cG ) 如 
此急剧地增长，以致在我们对 （5) 有任何实质性的改进以前，就需要《的非常大的 
值。而且，它对于理论的目的说来，也不是令人满意的，因为它不能充分发挥多项式 
方法的全部威力，而这个方法正是它的基础。如果让 r 同 n —起变动，即随 n 的增 
加而选择越来越大的 r 值，则我们就可以得到一个更好的结果。这个思想是由 A . 
L . 丁 oom 提出的 [Doklady AkacL Nauk SSSR 50 (1963)， 4% 〜 498 ，英译见 SoWef 

Mathematics 3 (1963) ,714 〜 716] ，他用这个思想证 明：当 77 增长时，可用相当少的 
部件来构造？ 2 位数乘法的计算机线路。后来， S . A . Cook[On the Mininum Computa ¬ 
tion Time of Functions (哈佛大学论文， 1960) ,51 〜 77] 说明了如何采用 Toom 的方 

法加快计算机程序。 

在进一步讨论 Toom - Cook 的算法之前，让我们研究从 L / U 〉 和 VU ) 转换到 
WU ) 的系数的一个小例子。这个例子并不说明这个方法的有效性，因为数太小 
了； 但它指出了在一般情况下可以做的某些有用的简化。假设我们要进行2/ = 1234 
和 i ；=2341 的乘法，在二进记法下，这是 

u = (0100 1101 0010) 2 乘以 v = (1001 0010 0101) 2 (12) 


设 r = 2;(8) 中的多项式 U { x ), V ( x )~^ 

U ( x ) = 4 x 2 + 13 .x + 2, V { x ) = 9« z 2 十 2 :c + 5 

因此我们发现，对于 WU )= U ( x ) V ( x ) 1 


U (0) 二 

= 2 , 

u ⑴ = 

= 19, 

U (2) 

= 44, 

U (3) 

= 77 ， 

U (4 ) : 

: 118 ； 

v( 0 ) = 

= 5, 

V(1)= 

= 16, 

V(2)= 

= 45 , 

V(3) 

= 92, 

V(4) = 

= 157 ； 

W (0) = 

= 10 , 

W(l)= 

= 304, 

W (2 )= 

= 1980, 

W(3) 

- 7084 ， 

W (4) = 

= 18526 


(13) 
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我们现在的工作是从后边五个值来计算 WU ) 的五个系数。 


有一个吸引人的小算法，当给定值 W (0), W ( l) f 


■ ■ ■ 


， w ( 


m 


1) 时它能用来计 


算多项式 W(x 


W 


))} 


I X 


m ^ 1 


+ 


+ W 


1工 



研。的系数。让我们首先写 


W ( x ) 


= a 川一十 a m ^ix rn —^ + ••• + aijr 丄十 a 0 


(14) 


其中 x ~~ x{x — 1) 

的性质，即 


籲 « 


(: T - A +1)， 而且其中诸系数 a , 是未知的。降阶乘幂有重要 


W(x + 1) - w ( x ) 




m 


— l ) a m _ 1 x — + ( 


m 


~ 2) a w — 


2工 


"I 一 3 




+ 


•鲁 ■ 


十 a 


因此由归纳法，我们发现对于所有 


k \ 


( W ( 


X 



k ) - [ k l ) w (^ ^ k -1) 



k 

2 


W ( 


X 


+ k - 2、 一 



(- l )々 W ( x )) 


m 


-1 



& m - 1 I 


m 


1 一右 



m 


- 2 


k 


m — 2 — k I 
- + 


十 


k 

k 


a 公 


(15) 


以 （1 M !) VW (: r ) 表示 （15) 的左边，我们看到 





々⑴(工 + 1 卜 


(k ~1)\ 


A 


是 一1 


W ( 


X 


而且 （1 M !) A 々 W (0) 


a ko 所以，利用一个非常简单的方法就可以计算系数 a ，， 这里 


以 （13) 中的多项式 WU ) 来说明 


泰 

暴 


10 

294 





304 

1676 

1382/2 

= 691 

1023/3 

= 341 

1980 

5104 

3428/2二 

1714 

1455/3 

二485 

7084 

11442 

6338/2 - 

3169 



18526 







144/4 


36 


(16) 


这个表最左边一列是 W (0)， W ( l )， …， W (4) 的给定值的一份 清单； 通过计算前列 
逐个值之间的差并除以 I 就得到第々列。系数~出现于这些列的顶部，于是 a 0 二 


10， (2 


294，…， a 4 


36,因此我们有 


W ( x ) 




36 x - + 341 jc - + 69 lx ~ + 294 jc - + 10 


(((36(工 - 3) 



341 )(：r - 2) + 691 )U - 1) 



294) 


x 



10 


(17) 


般说来，我们可以写 
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W ( x ) 


馨 ♦參 


((a 


m 


1 


(x - 


m 


+ 2 ) + 


m 



3 ) 十 


a m - 3 )( 工 


m 



4 ) 十 


# § 參 


+ a x + aQ 


而且这个公式说明了如何能从诸得到系数，…， Wi ， 


36 

341 

-3-36 



36 

233 

-2.36 

691 

-2-233 


36 

161 

255 

294 


-1-36 

-1-161 

-1.225 


36 125 64 69 10 


(18) 


这里水平线下的数逐次地表示多项式 


- 1 

a m -\{x - m + 2) + a m — 2 

{a m -i{x - m + 2) + a m _ 2 )(x — m + 3) + a m _ 3 

等的系数。 

由这个表，我们有 

W ( x ) = 36/ + 125x 3 + Mx 2 + 69a ： + 10 (19) 

所以原来问题的答案是 1234X2341 = W(16) =2888794, 其中 W(16) 通过加法和移 
位得到。 4.6.4 小节讨论了这个求系数方法的一个推广。 

等式 1.2.6-(45) 的基本的斯特林恒等式 


X 






n 

0 


说明，如果 W (: T ) 的系数非负，则数 A 也非负，而且在这种情况下，上述计算中的所 

有中间结果非负 。这就进一步简化了 Toom - Cook 的乘法算法。我们现在详细讨论 
这个算法（而心急的读者应该跳到以下的子小节 C )。 


算法 T ( 二进制数的高精度乘法） 给定一正整数 n 和两个非负的 n 位数 W 和 

I 这一算法给出它们的2〃 位乘积使用四个辅助栈来存放进行这一过程期间所 
处理的 数字： 

栈 U f V ： 步骤 T 4 中的 L / G ) 和 V 。）的临时存储单元 
栈 C : 要做乘法的数以及控制代码 

栈 W : W ( j ) 的存储单元 
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这些栈可以包含二进数或者称为代码1、代码2和代码3的特殊控制符号。本算法 
也构造数 q k 、 r k 的一份辅 助表； 维持该表的方式是，它可以存作一个线性表，其中遍 

历这个表（前后移动）的一个指针可用来访问当前感兴趣的表项。 

(栈 C 和 W 以一种相当直截了当的方式来控制乘法算法的递归机制，它是第8 

章讨论的一般过程的一个特殊情况。） 

T1 •[计算表]置栈 U ， V ， C 和 W 为空。置 

々 — 1， go — — 16 ，厂 o — 厂 4 ， Q— 4 ， R ^ 2 

现在如果 q k -x + q k <n ，则置 

々—々 + 1 ， Q — Q + R ， R —L v^Q J , qk 2 Q , r k 2 r 


并重复这一操作直到 qk -\ + qk >“ (注： 的计算不要求开平 

方，因为，如果 （尺 + 1) 2 < Q 则我们只需置尺 f 尺+ 1，而如果 （尺 + 1) 2 > Q ， 

则保持尺 不变； 见习题2。在这一步骤里我们构造序列 

k = 0 1 2 3 4 5 6 


q k = 2 4 2 4 


2 6 


2 8 


2 10 2 13 


2 16 



r k = 2 2 2 2 2 2 2 2 2 3 


2 3 2 4 … 


70000位数的乘法，将使这步以 A = 6终止，因为 70( K )0<2 13 + 2 16 。） 

T2 .[把压入栈]置代码1于栈 C ， 然后把 w 和 r 作为两个恰有 +w 


位的数压入栈 C 。 

T 3 .[校验递归层次] A 减1。如果 A =0,则堆栈 C 顶部含有两个32位数 w 
和 w 把它们去掉，并利用 一个乘 32位数的内部程序置 w — ⑽ ，转到步骤 
丁 10。如果々 >0，则置 r — q g —wP — % - 1 + %，并继续进行到步骤 T 4。 

T 4. [分成 r + 1部分]把栈 C 顶部的数看成是 r + 1个 g 位数的一份表 （ U ，" 

LAr / o ) 〆 栈 C 顶部现在包含一个 O + l ) g 二（％ + % + 位的数）。对于 

j =0， l ，〜，2 r 计算 p 位数 

(* * * ( U r j + U r ])j + …+ U { )j + U Q = U ( j ) 

并且逐次地把这些值压人栈 I /。（栈底现在包含1/(0)，然后是1/(1)，等 
等，而[；(2幻在顶上。由习题3有 

U ( j ) < U ( 2 r ) < 2 q (( 2 r) r + (2 厂广 1 + …+ 1 ) < 2 q + l ( 2 r) r < 2 P ) 

然后从栈 C 消去 

现在栈 C 顶上包含另外 r + 1 个 g 位数的表 V Q ，而且 f 位数 

(_•.(%.+ V r ^)j + ■•- + V,)j + V 0 = V { j ) 

应以同样方式压入栈 V 。在这完成之后，从栈 C 消去 V ,… KVo 。 

T 5 .[递归]逐次地把下列各项压入栈 C ， 同时消除栈 U 和 V 中的 内容： 

代码2, V (2 r )， U (2 r )， 代码3, V (2 r - l )，[；(2 r - l )，“*， 

代码3, V ( l )，[；( l )， 代码3, V (0)， U (0) 
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返回步骤 T 3。 


T6 •[保存一个乘积](这时乘法算法已经置 tt ， 成为诸乘积 W(j)=U(j)V(j) 

之一。）把加压人栈 W (数 u ； 包含 + 位）。返回步骤 T 3。 


T 7 .[求诸 a ] 1 r — r k ，q — q k ， p — qk -\ + qko (这时栈 W 从底到顶包含一系 

列数，以 W (0)， W ( l ), …， W (2 r ) 结束，每个 WG ) 是一个20位数。） 

现在对 j = 1,2,3 , ,2 r 实施下列循环：对于 t = 2 r ,2 r - 1 ,2 r - 2, , 

置 W ( 0 —( 0 _ - 1 ) )/ 7 。（这里 ） 必须增值，而，必须减值。量 

( W ( t )- W ( t - l )) lj 将总是一个可用位表示的非负整数，参考（16)。) 
T 8 •[求诸 W ] 对_;=2「-1，2厂-2^"，1实施下列循环 ： 对于+ 

2 r _ 1 ，置 W ( t)^W { t ) - + 1 )。（这里 7 必须减值且 Z 必须增值。 

这一运算的结果将再次是一个非负的位 整数; 参考（18)。） 

T 9. [置答案]置 w 成为 2( % + % + 1) 位整数 

(-( W ( 2 r ) 2 q + W ( 2 r - 1))2 V + …+ W ( l )) 2 q + W (0) 

从栈 W 消去 W (2 r )， …， W (0 ) o 

T10. [返回]置6+ 1，消去栈 C 的顶部。如果它是代码3,则转到 T 6。 如 

果它是代码2,则把它压入栈 W 并转到 T 7。 如果它是代码1，则终止这一 

算法 （ w 是答案 ）。I 


现在借助于我们所说的“周期”的某些东西亦即基本的机器操作时间，来估计算 
法 T 的运行时间 T ( n ) 0 步骤 T 1 花费0(%)个周期时间，即使我们在内部把数％ 

表示成一个在后边加上某个限定符的 w 位的长串也一样，因为 W + W-i +…+ go 
仍将是0(%)。显然，步骤 T 2 花费0(%)个单位时间。 


t 



图8 高精度乘法的 Toom - Cook 算法 

现在命4表示对于一个特殊的々值 （在々 的值于步骤 T 3 开始时减小了之后) 

为从步骤 T 3 达到丁10所需的计算数量。步骤 T 3 至多要求 0( g ) 个周期。步骤丁4 
包含 r 个 （ ig 2 r ) 位数乘以一个 p 位数的乘法，以及 r 个 p 位数的加法，全部重复 4 r 
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+ 2次。于是，我们需要总共 0(r 2 (? log r) 个周期。步骤 T 5 要求移动 4 r + 2 个 p 
位数，所以它包含 O( n ) 个周期。步骤 T6 要求 O(g) 个周期，而且每次迭代它都做 
2r + l 次。当算法实际上调用它自身时（通过返回步骤 T3)， 涉及的递归每次要求 
G-i 个周期， 2r 十1次。步骤 T 7 要求 0( r 2 ) 个 f 位数的减法和位数除以 

( lg 2 r ) 位数的除法，所以它要求 0( r 2 g log r) 个周期。类似地，步骤 T8 要求 
0 ( r 2 q log r) 个周期。步骤 T 9 包含0 ( q ) 个周期，而且 T10 几乎全然不花费任何 

时间。 

总计起来，我们有 TO) = 0( % ) + 0( %)十 4-! ，其中（如果 q = qk 
对运行时间的主要贡献满足 

t k — 0 { q ) + 0 ( r 2 q log r) + O ( rq ) + (2r + 1)0(^) + 0 ( r 2 q log r ) + 

0 ( r 2 q log r ) + 0( rg ) 十 0((?) + (2r + 1 ) t k - X - 
0 ( r 2 q log r) + (2 r + 1)4-! 

于是有一常数 c， 使 

t k < cr \ q k lg r k + ( 2 r k + 1)4-1 

为了完成对 h 的估计，我们通过硬算可以证明对于某个常数 c， 

t k < CQ + 1 2 2 .V lg 〜+i (20) 

我们选择 C>20c， 并把 C 也取得足够大，使 （20) 对于成立，其中心将在下 
边加以确定。于是当 k > k 0 时，令 Q k = \g q k ,Rk = k 由归纳法有 

t k 《 lg 厂方十 （ 2 r 々 十 l ) Cq k 2 2 ' 5 ^^^ ― Cq k + { l 2 ' 5 ^ Xg ( r ]\ + 72 ) 

其中 

Vl = * R k 2 R 「 15 ^^ < >2-' < 0.05 
72= (2 + ^2~ 1/4 < 0.85 

因为当 6 — 00 时， 

- -- 1 

一 \! Qk ~ a/ Qk ~*~1- V Qk 」 _ \! Qk 一了 

由此得出，我们可以求出々0,使得对于所有々 >々0,仍<0.95,按归纳法这就完成了 
(20) 的证明。 

因此，最后我们可以估计 T(n)o 由于行〉…-〗. w - 2 , 我们有因此 

r k . x = 2 Lv/lg ^-» J < 2^^ ,且 W 二 < n 2 ^ n 

于是 

t k _ x < C ^2 2 - 5 v ^ < Cn 2 ^ +2 - 5(/ ^ + l) 

而且由于 T ( n ) = 0 ( q k ) + G — i ，我们最后导出了以下定理： 

定理 B 存在一个常数 CG , 使得算法 T 的执行时何小于以”2 3 5/ ^个周期。 • ■ 
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由于 n 2 3 - 57lgr< - 7 z l + 3 - 5/yig ，这一结果比定理 A 强得多。对这个算法稍加复 
杂化，把上述思想施加于明显的极限上（见习题5)，我们就可以把估计的执行时间 
改进为 

T(n) = 0(^2 /T¥7, log n) (21) 


.—个模方法 有另一个非常快地乘大数的方法，它是以 4.3.2 小节提出的 
模算术的思想为基础的。开头很难相信这个算法能有什么好处，因为基于模算术的 
乘法算法除了乘法运算本身之外，必须包括模的选择以及这些数到模表示的来回转 
换。不过，尽管有这些难以对付的困难， A . Schdnhage 还是发现，所有这些运算都可 
以非常迅速地完成。 

为了了解 Schduhage 方法的实质性机理，我们将考虑一个非常特殊的情况。考 
虑由规则 

g 0 = 1 ， q k + [ = 3^-1 (22) 


所定义的序列，使得 q k = 2 k -3 k ^ 1 - 1 = + 1)。借助于乘久叫位数的 


乘法，我们将研究乘九位数的过程，其中 p k = (18^ +8)。于是，如果我们 

知道怎样乘有 丸 = 26位的数，则要描述的这一过程将向我们显示怎样来乘 Pi =44 

位的数，然后是98位的数，再后是260位，等等，最后每步使位数几乎以3的因子增 
长。 


当乘九位数时，其思想是使用6个模 

m { = 2 6 ^ -1 一 1 ， ? n 2 = 2 6 ^ + 1 - 1 , = 2 6 ^- +2 - 1 

m 4 = 2 6<7 * +3 - 1 ， ms = 2 6y ^ +5 - 1, m 6 = 2 6 ^ +7 - 1 


(23) 


由等式 4.3.2-(19)， 这些模是互素的，因为指数 


6% — 1 ， 


6 qk 



6^ + 2, 


6 q k 



3, 


^Qk 



5, 


6^ 



7 


(24) 


总是互素的（见习题 6) 


O 


(23) 中的6个模有能力表示直到 m 


m i m 2 3 m 4 772 5 772 6 


> 2 36 ^ 


16 


2 2 心的数，所以在九位数〃和 t ； 的乘法中没有机会溢出。这样我们可 


以使用下列方 法：当 6>0时， 

o ) ui ~ u mod ， •• •，以 6二 


u 


mod m6 ; 以及 v \ — v mod m { , • • • ， = 


v mod m^o 

b ) 心乘以乘以 ％，•• •，“ 6 乘以。6。这些至多都是 + 7= 18+ 1 
<九^位的数，所以通过使用假设的九 m 位乘法过程即可实施乘法。 

c ) W [ = U [ V [ mod m t , W2 ~ u 2 V2 mod 7 / 12 ， ••• ， ^6 = U 6 V 6 niod m ^ 0 

d ) 计算 w ， 使得 0^ vj ^ m y vu mod my = yiv mod m 6 31 vu^o 

设 4 是这一过程所需要的时间数量。不难看到，运算 a ) 花费 0( 九）个周期，因 

为如 4.3.2 小节所示 ， w mod (2^-1) 的确定是十分简单的（像“舍九算法”）。类似 
地，运算 c ) 花费 0 ( 久）个周期。运算 b ) 实际上要求 64 ^个周期。剩下运算 d )， 它 
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似乎是一个十分困难的计算，但 Sch 6 nhage 已经找到在 O ( /々 log 九）个周期中实现 
步骤 d ) 的一个巧妙的方法，而且这是这个方法的关键。结果，我们有 

4 = 64 — 1 + 0( p k log p k ) 

因为九二3〃 2 + 17,我们可以证明进行”位乘法的时间是 

T ( n ) = 0(?2 log ^) = 0(” 1 631 ) (25) 

(见习题17 0 ) 

所以尽管模方法比在这节开始所讨论的0 (7^ 3 )过程更为复杂，但事实上，等 
式 (25) 表明，它确实导致比 n 位数乘法的 0 U 2 ) 实质上更好的执行时间。于是我们 
看到如何使用两种完全不同的方法中的任一种来改进经典的方法。 

现在我们来分析以上的运算 d )， 假定给了我们两两互素的正整数^<^ 2 < 


< ;设 

m { = 2 e i - 1, ? n 2 = 2^-1， … ， m r 二 2’ - 1 (26) 

而且也给了我们数 w !_，…， Wr ，使得0 < 。 我们的任务是来确定数■^的 一 

进表示，它满足条件 


0 ^ w < mini2 … 爪 ” 


W 


W \ (modulo m \) , 


麄 ■ 


U ) 


xv r (modulo m r 


(27) 


这个方法基于 4.3.2 小节的 （24) 和 （25)。 首先对于 j = 2,…， r 计算 


/ 







/ 


/ 


IV; 




IV 


)^2； 


U ) 


/ i ， l ) c (j - [ ) j mod m 


(28) 


其中 vo \ = wi mod m i •，然 后计算 

w — (- w 


/ 



Uj^- 


1) 


2 




) m 1 + zv [ 


(29) 


这里是使得~/^三1 (modulo %) 的一 个数； 这些数 ~ 均未给出，它们必须由诸^ 

确定。 


对于所有厂计算 （28) 包含^个模加法（它们中的每一个花费 ◦( 〜）个周 


期），加上个乘以4的模乘法。通过公式 (29) 来计算 w 需要 r 个加法和 r 个 

乘以％的 乘法； 以％来乘是容易的，因为这仅仅是相加、移位和减法，所以显然等 
式 (29) 的计算花费 0( r 2 ^) 个周期。我们马上就将看到，乘以 c tJ M 的乘法，仅 
仅要求 0( 〜 bg 〜）个周期，因此，整个转换工 作可以 在 0( r 2 e r log 个周期中完 

成。 

上述的考察留下了下列问题需要解 决：给 定正数 e 和/且6</，和一个非负整 

数 w <2’，计算 （cw ) mod (2’ _ 1) ，其中 c 是使得 (？ - l ) c 三1 (modulo 2’ _ 1) 的数; 

而且这整个计算必须在 0(/ log /) 个周期中完成。习题 4.3.2-6 的结果给出了关 
于 c 的一个公式，它提出了一个合适的过程。首先我们求最小整数纟使得 

be = I (modulo /) (30) 

利用欧几里得算法将在 0 ((log /) 3 )个周期中发现因为当应用于 e 和/时它要 
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求 0 (log /) 次迭代，而且每次迭代要求 0 ((log /) 2 )个 周期； 另一种方法，我们在这 
里通过简单地试验6 = 1，2,等等，可以非常粗略地进行，而又不违背总的时间限制， 
直到 （30) 被满足 为止； 这样的一个过程全部将花费 0(/ log /) 个周期。一旦已经求 
得则习题 4.3.2-6 告诉我们 


C 


c[b] = ( 2 2 je ) mod (2, _ 1) 

0^j<b 


(31) 


硬算 （ a ) mod (2/-1) 的乘法，对于解决这个问题来说是不够好的，因为我们 


还不知道怎样在 0(/ log /) 个周期中乘一般的/位数。但是 c 的特殊形式提供了 
一条线索： C 的二进表示是由排成正规模式的一些二进位组成，而且等式 （31) 说明， 
数 c [26] 可以以简单的方式从得到。这提示，如果我们以适当灵活的，比如说 
如下的方法，在 lg 6步中构造，则我们可以迅速地进行数 W 和的 乘法: 
设 b 的二进记号是 


b = (b^-b 2 b l b 0 ) 2 


我们可以计算由如下一些规则定义的序列 和％: 


aQ = e y a k — 2a k - { mod / 

d 0 = b 0 e , d k - 十 b k a k ) mod / 

uq = u } u k = (u k -\ + 2 a k-i u k -\) mod (2’ - 1) 

v 0 = bou f v k = ( v k - 1 + b k 2 d k~\u k ) mod (2 f - 1) 


(32) 


对々用归纳法容易证明 

a k = (2 k e ) mod f\u k = { c[2 k ~\u) mod (2’ - 1) (33) 

d k = b niod f \ v k - (c[ ( 心…心办。)。] w ) mod (2’ - 1) 

因此所希望的结果 ， （c [ △ ] w ) mod ( 2 ’- 1 )，是 1 ^。由 〜_ i ， A _ ii 〗计算 


a k ， d k ， u b ， v k M ： 0 (log /) + 0 (log /) + 0(/) + 0(/): 0(/) 个 周期； 因此整个 

计算可以像所希望的那样在 50(/) = 0 (/log /) 个周期中完成。 

读者将发现，非常仔细地研究由 （32) 和 （33) 表示的灵巧的方法是有教益的。 
4.6.3 小节讨论了类似的技术。 

Sch 6 nhage 的论文 [Comput/ng 1 (1966) ， 182 〜 196] 证明，利用 r ^2^ 2 ^ n 个模, 
这些思想可被扩充到72位数的乘法，并得到类似于算法 T 的一个方法。我们在这 
里将不详述细节，因为算法 T 总是优 越的； 事实上，一个甚至更好的方法是我们的下 
一个议题。 


C . 离散傅里叶变换 在高精度乘法中关键的问题是“卷积”，例如 

u r v Q + u r ^i Vi + ••• + UQV r (34) 

的确定，而且在卷积和称为傅里叶变换的一个重要数学概念之间有着密切的关系。 
如果 o ； = exp (27 ri / iC ) 是 _ K 次单位根，则复数序列，…，^/^。的一'维傅里叶 

变换可以定义为（心， 泣1 ，…，没/< - 1 ) ，其中 
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H s = 2 a ) st u t ， 0 < s 〈 K (35) 

0</< K 

设 （6。 ， A ， … ， 如- 1 ) 以同样方式定义 r^ivQyVy ，- ** , V K - { ) 的 傅里叶变换一样，不难 

■ 

看岀 ，（心 公 0 ，6丨，…，％ — 1% — 1 ) 是（初0， 加1 ，…， Wn ) 的变换，其中 


w r 


—■ li r TJ q U r — 

E 


i r 1 + …+ u 0 v r 

Ui^j 


+ + … + U r +[^ K -\ 


(36) 


/ 十 j= r( modulo K) 

当 72 _ 1 和 〜 =^n + i = … = ^K-\ = V n ~ A 十 1 = … = V K-\ ~ ^ 时，诸 tt 1 恰是 

我们所需的乘积，因为当 0< r <2 n -2 时，项叹 -iW + i +…+〜+ i 即 - i 消失。换 


句话说，一个卷积的变换是这些变换的普通乘积。 这一思想实际上是 Toom 使用的 

多项式的一个特殊情况（参考 （10)) ，其中以单位根代替： t ：。 

如果 K 是2的幂，则当以某种方式安排计算时，可以十分迅速地得到离散傅里 
叶变换（35)，而且逆变换也这样（即由诸 w 确定诸加）。傅里叶变换的这个性质是 
由 V . Strassen 于1968年剖析的，他发现了比过去所有已知的方案都快的大数乘法 

规则。他和 A. Sch6nhage 后来改进了这个方法，并在 Compunng 7 (1971) , 281 — 

292上发表了改进了的一些过程。类似的思想，但是用于所有都是整数的方法，是 

由 J . M . Pollard 独立地给出的 [ Math . Comp . 25 ( 1971 ) ，365〜374 ] 。为了 / 解他们 

解这个问题的方法，我们首先看看快速傅里叶变换的机制。 

给定 K =2&个复数（^0,…，的 一 个序列，并给定复数 

00 — exp(27ri/ K ) (37) 

通过执行下列方案可以快速地计算在 （35) 中定义的序列 U G ， …，（在这些 


公式中，参数~和^或者是0,或者是1，使得每一“趟”表示 Y 个初等的计算 

趟 0 设 A[ 0 」（k — t ，…， h ) = ，其中 t = ( t k - i ". t Q ) 2 

趟 1置 A 2,…，以）— 



A ⑻ 
置 A [ 2 ] 


(0,々 — 2 ，…， ， o ) + ⑴ 2 V 〗 A [0] 

( s k - \ s k - 2 山 _ V ，’ 0 )— 




A [ L :' U - 





由归纳法相当容易证明，我们有 





其中,= ( 心 — 1…乙1 ,0)2 

使得 

A [“（5 丄，…，&，〜）=&，其中 S …以- 1)2 ( 39 ) 
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(重要的是注意 s 中二进数字在最后的结果 （39) 中被颠倒了， 4.6.4 小节包含关于 
这样的变换的进一步讨论。） 

为了由 Uo , … Jk - 0的值得到逆傅里叶变换 U G ，" •，叫，请注意“双重变 
换，，是 

“r 二 (JJ s = 〉: (JL) rS (Jj St U t — 

0 < s < K 0< s , t<K 

X W ( S + ）= Ku .(_ r ) mod K (40) 

0< z < K 0< x < K 

因为除非_；是尺的倍数，否则几何级数的和为0。因此逆变换可以和变 

换本身同样的方式来进行计算，只是最后的结果必须除以 K 和稍微“洗”一下。 

回到整数乘法的问题，假设我们希望计算两个 n 位整数 w 和^；的乘积。和在算 
法 T 中一样，我们的处理对象是 位组； 设 

2 n ^ 2 k l < 4 ? i , K = 2 \ L = 2 1 (41) 

而且写 

u = dr.UiUoLv 二 ((42) 

把“和 I ；看做是 L 进制下的 K 位数，因此每个数字 K 或是一个/位整数。实 

际上，对于所有前导数字和 V 」为0,因为 2 k -' l > n 。 以后我们将选择 

对于々和 Z 的适当值；我们暂时的目标是一般地看看发生什么情况，使得当所有事 
实出现在我们面前时能明智地选择々和/。 

乘法过程的下一步是计算序列 U G , …，1^_ 1 )和0 () ，…，即― 1 ) 的傅里叶变换 

( ，…，如―；! ） 和 “ Q ，…， f) K — i ) ，其中我们定义 

U t = Uj 2 k + l y V t = Vj 2 k + l (43) 

这一调整是为了方便而进行的，使得 〜和％ 小于2-、确保对于所有绝对值 | 心 | 
和1化1都将小于1。 

这里出现一个明显的问题，因为复数⑴不能精确地以二进制记号表示。那我 

们怎样计算一个可靠的傅里叶变换呢？真走运，如果我们仅仅以适当的精度进行计 

算，则将一切顺利。我们暂时回避这个问题并假定用的是无限精度的计算，后边我 
们将分析真正需要多少精度。 

—旦已经找到 A 和％，我们就对于 0<5< K 令私 =并确定逆傅里叶变换 

(叫，…，！^—!)。如同上边说明的那样，现在有 

叫 = S = 2 U , Vjl 2 lk+11 

j _j_ _ ^ ■卜 k _ 

使得整数 W r ^ 2 lk + 2 l zv r 是所求_积 ) 

U • V = W K _ 2 I /- 2 + …+ WyL 1 + W 0 (44) 

中的系数。由于 0< W r <( r + l ) L 2 < KL 2 , 每个至多有々+2/位，所以当诸 W 
已知时，计算二进表 7 K 将是不难的， 除非々 相对于/很大。 

例如，假设当参数是 A =3和/ =4时我们要来把《 = 1234和 t ；= 2341相乘。 
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从“开始对 U Q ，…， a 7 ) 的计算进行如下（请见 （12)): 

(厂山 r ) = (0,0,0) (0,0,1) (0,1,0) (0,1,1) (1，0,0) (1,0,1) (1,1,0) (1,1,1) 


2 7 A [0] ( r , 5 , r )- 

2 7 A [1] (r,5,0 = 

2 1 A [2] {r y s y t )= 
2 7 A [3] ( r , 5? r ) = 


2 

2 


19 


13 

13 

13 

_7 


2 


0 

0 

13 


2 + 4 i 


13 

13 


一 2 + 13 i -2 - 13 i a + /? 



4 

2-4 i 

a-p 


13 

a + ^ 


这里 a 




2 + 4 i ，/3 二 13 


O ) 


和 


(JL) 




(l + 0 /力；这给了我们在表 1 中的以 2 \ s 打头的列。 


A 列以相同的方式从 w 得出； 然后我们把化乘以 h 得到 


利用关系 （40) 转换再 


次给了我们％和 W 


S 


o 


再次地我们得到 （19) 中的卷积，这次使用的是复数而不是坚 


持所有整数的方法。 

现在让我们尝试估计一下，如果在计算傅里叶变换中使用772个二进位的定点 
算术，对于很大的数这个方法花费多少时间。习题10说明在转换计算的所有趟期 
间由于 (43) 的比例，所有的量 A [ / 的数值都将小于1，因此对于所有中间的量的实 
部和虚部处理 W 个二进位的小数就足够了。由于输入乂和 T ； ，是 

实数值的，因此简化是可 能的； 在每步骤中只要进行 K 个实数值而不是 2 K 个实数 
值(参见习题4.6.4-14)。我们将忽略这样的改进以便使复杂性保持极小。 

表1通过离散傅里叶变换的乘法 



-7 12 -84 288 36 

2 + 4i-13a ； 5 + 9\-2 (o — 26 + 64i - 69 w + 125: 1000 0 


-2-13i -4-2i -18 + 56i 512 0 

2 — 4i+13: 5 — 9i + 2: - 26 - 64i- 125a> + 69^ 552 0 


头一个工作是计算 a ; 和它的幂，为简便起见，我们将构造值为，…， a / M 的 
一张表。命 

a ),. = exp (27 ti /2 r ) (45) 

使得 cv 1 = — 1 , ct)2 = i , a>3 = ( 1 + i )/ V 2 ，…，叫= a > 。 右 a >,. = : r r + i _ y r ， 则我们有 co r + y = 

1 + & + 1， 其中 



[参见 S . R . Tate ， IEEE Transcations SP 43 (1995) ， 1709 〜 1711 。]相对于我们所需 
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要的其它计算说来， ^， o ; 2 ，•••，％的计算花费的时间可以忽略，所以可以使用任何 


直截了当地计算平方根的算法 


o 


旦已经计算了 


CD 


，我们就可以通过注意到 


o/ = 如果 J = (乂 — r ‘ Vi 九 )2 (47) 

来计算所有乘幂 o /。 这个计算方法防止误差传播，因为每个0/是顶多 々个 0 V 的乘 

积。计算所有 g / 的全部时间是 O ( KM )， 其中 M 是进行 m 个二进位复数乘法的时 
g 因为从一个以前计算的值得到每个0/只需要一个乘法就够了。随后的步骤将 

多于 O ( KM ) 个周期，所以⑴的乘幂在可忽略的花费下就已可计算出来。 

三个傅里叶变换的每一个都由々趟组成，其中的每一趟包含形如 a — 6 + Jc 的 

K 个操作，所以为计算傅里叶变换所需要的全部时间是 

O ( kKM ) = O ( Mnkll ) 

最后，使用 （44) 计算的诸二进数字所需工作量是 0 (KU + /))= 0 (n + nkll ) 0 
把所有这些操作加起来，我们发现，为乘 n 位数^和的全部时间将是 0( n ) + 
0( Mnk 11) o 

现在看看中间精度 m 需要多大，以便我们能知道 M 需要多大。为简便起见， 
我们将满足于对精度的安全估计，而不去寻找最好的界。以这样的方式来计算所有 
a / 是方便的，即使得我们的近似将满足 1( 如果我们向零的方向截断 

而不是舍入，这个条件就容易保证，因为在 （46) 中 4 + i + W +1 二 （1 + W + / + 

2 x r ) K 2 + 2 x r ) 0 对于 m 位定点复算术，我们需要实施的操作都由以近似计算 

o / 一 truncate ( b ' + ( ^ ) V ) (48) 

代替形如 a — b + a / c 的精确计算而得到，其中 6，（ oyV 和 〆 是以前算出的近似值。 
所有这些复数和它们的近似绝对值都以1为界。如果 I y ， I (wy - a / 1 < 

和 | 〆 - c |<》 3 , 不难看出将有 | 〆 -a | <5 + 6 +》3,其中 

8 = \2 ~ m + 2— w i | = 2 1/2_m (49) 

因为我们有 I (W ) V — a/c | = | (( a / )' - co j ) c ' + cJ ( c ' - c ) I ^^2 + 汸 3 , 而且汸超过极 

大的截断误差。由 （46) 中定义的数的近似值 < 开始，可得近似 （ a /)/， 而且我们可 

以假定 (46) 是以充分的精确性实施的，使得 | a >; - a^l <3。于是 （47) 意味着对于所 

有的 hKa / V - a/ICUA -1) 夂因为这个误差是由于至多々个近似和々 -1 个截 
断所致。 

如果在任何一趟快速傅里叶变换之前有至多为 < 的误差，则该趟操作应有 （48) 
的形式，其中心=心=^，且 S 2 = (2 k -1)5; 而且在这趟之后的误差至多将为 h + 

2 kS 0 在第0趟没有误差，所以通过对 ； 用归纳法我们发现在第7趟之后的极大误 
差以 (2 J -1) 为界，而且所计算的心值将满足 1(^)/- 心|<(2& - 1)_2 M 。 对 

于 （A V 类似的公式 成立； 而且我们将有 

| ( w s Y - w s I < 2(2 k ~ 1) • 2 kS ^ 8 < (4/ c 2々- 2 k)S 

在逆变换期间有一个附加的误差累计，但除以 K =2 k 的除法会改进其中的大多数 
误差； 按照同样的论证，我们发现所计算的值将满足 
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( w r Y - vu r \< 2 k ( Ak 2 k - 2 k )$ + (2 k - l )2 kS ； \ -叫 | < 4 k 2 k 8 (50) 

我们需要足够的精度使 2 lk + 1 ! w ' r 舍人到正确的整数因此我们需要 


^2 々十 2/ + 2+(lg k ) 十 k 十 ll2 — rn 



(51) 


即十2/ + lgA +7/2。如果我们只是要求 

k>l 和 m ^4 k + 2/ (52) 

则这将成立。关系 （41) 和 （52) 可用来确定参数 k ， I ， m 使得乘法花费 0(72) 十 

0( Mn 々/ Z ) 个时间单位，其中 M 是乘 m 位小数所需的时间。 

比如说，如果我们使用的是 MIX ， 假设我们要来乘每个有77 =2 13 = 8192位数的 
二进数。我们可以选择 々二 11，/ 二 8, m =60,使得必要的 m 位操作不过是双精度 
算术。因此，进行定点 m 位复乘法的运行时间将相对地小。对于三倍精度运算我 
们可以增加到比如说 A = / = 15， n <15 X 2 14 , 这超出了 MIX 的内存容量。在一个更 
大的机器上，如果我们取 A = / = 27和 m = 144,我们可以对一对吉比特的数做乘 
法。 

关于々，/和 m 的选择的进一步研究导致令人惊奇的结 论:对 于所有实用的 g 
的来说，我们可以假定 M 是常数，而且 Sch 6 nhage - Strasseii 乘法技术将有与 w 成线性 
比的运行时间。 原因在于我们可以选择 k = L 和 m = 6々； A 的这个选择总是小于 lg 
n ， 所以我们将绝不需要使用6倍以上的精度，除非 n 大于我们的计算机字大小（特 
别是72将要大于一个变址寄存器的容量，所以我们大概不能把数 w 和 u 放人主存 

中） 。 

因此，除开常数因式的改进之外，快速乘法的实际问题已经解决了。事实上，对 
于实用的高精度乘法来说，习题 4.6.4-59 的全整数卷积算法大概是一个更好的选 
择。然而，我们对于乘很大的数的兴趣有一部分是在理论上的，因为探讨计算复杂 
性的最终极限是有趣的。所以让我们忘记实用的考虑并假设77极其大，也许比宇宙 
中原子的个数还大得多。可以令 w 近似于6 lg 〃，而且递归地使用同一算法来做 
m 个二进位的乘法。运行时间将满足 T ( n ) = 0( nn\og 〃））； 因此 

T ( 77 ) ^ Ct 2 ( C lg ?2 ) ( C lg lg 72 ) ( C lg lg lg n ) (53) 

其中乘积继续进行到满足 lg … [g nd 的一个因子为止。 

Sch 6 nhage 和 Strassen 在他们的论文中指出如何通过使用整数 w 来做模 2 e + 1 
的整数傅里叶变换，以便把这个理论上界改进为 OU log n log log ^)。这个上界 
可应用于图灵机，即应用于具有有限内存的有限个任意长带的计算机。 

■ 

如果允许用一个更强有力的计算机，并且随机访问有限长的任意个字， 
Schonhage 已经指出上界降低到 0( n log /? ) 。 因为我们可以选择 k = /和 w = 6 是， 

而且对于 0<: r ，^<2 U /121 我们有时间来构造所有可能的乘积 a 的一个完备的乘 
法表（这种乘积的个数是/或 Y + 1 ， 而且我们可以在 0 U ) 步内通过由每个表项的 
前组项之一的加法计算岀这个表项，因此对于这个计算来说 0( k 2 k ) = 0(72) 步就 
足够了）。在这种情况下， M 是在 2 uml 进制下进行12位算术所需要的时间，而且 
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由此得出 M =0(^) = 0 (log n )， 因为1位乘法可以通过查表完成。（假定访问内 
存的一个字的时间同该字的地址中的二进位数成正比例。） 

而且， Sch 6 nhage 在1979年发现 ，一 个指针机器可以在 O ( n ) 步之内进行 n 位 
乘法； 请见习题12。如同在 2.6 节末尾所讨论的，当时这样的装置（它也叫做 
“存储修改机器”和“链接自动机”）似乎提供了计算的最好模型。因此我们可以结 
论，无论是对于理论的目的而言还是对实用而言，在 OGO 步内进行乘法都是可能 
的。 

1986年，由 D . V . Chudnovsky , G . V . Chudnovsky , M . M . Denneau 和 S . G . Younis 

设计了一台称为小费马 （Lktle Fermat ) 的不同寻常的通用计算机，它具有快速地乘 
很大的整数的专门能力。它的硬件以快速的对257个二进位字的模2 256 十1算术为 
特征； 使用256单字乘法，连同只要求加法、减法和移位的三个离散变换一起，可以 
完成256字的数组的一个卷积。基于近似 60 ns 的一个流水线周期时间，这使得有 
可能在少于 0.1 s 的时间内来把两个10 6 个二进位的整数相乘 [ Pmc . Third Int . 
Conf . on Supercomputing 2 (1988 )，498 〜 499; Contemporary Math . 143 (1993)， 
136]。 


D . 除法既然我们已经有了乘法的有效子程序，现在考虑逆问题。结果是，除 
一 个常数因子外，除法可以像乘法那样快地实现。 

为了进行一个72位数 U 除以一个^位数 I ；的除法，我们可以首先找1/^的一个 
n 位近似值，然后乘以 u 以得到对于的一个近似值4。最后，我们可以利用另 
一个乘法对$做一点必要的校正，以确保 - qv < v 。 由此推理，我们看到，只 
要有一个近似一个72位数的倒数的算法就够了。下边的算法就是这样的，它使用如 
4.3.1 小节末尾所说明的“牛顿方法”。 


算法 R (高精度 倒数） 设 I ；有二进表不 w = (0 ‘ W W ")2 , 其中 =lo 这个 
算法计算 l / l 的近 似值％ 使得 


R 1 •[初始近似]置 


2 ； — 1 / 7 ^ | ^ 2T n 

z ^~ L 32 / + 2 i ；2 + 。3)」，和々一0。 


(54) 


R2 • „牛顿迭代](这时有 一 个二进形式 （. : o: …: r ) 2 的数2： ， 它在小数点后有 

+ 1位，而且 z <2。 ) 利用高速乘法程序，精确计算 z 2 = ( m : c : c …: r ) 2 。 
然后精确计算 Vp 2 , 其中 V k = (0 . ^2"* ^2 /，+ 1 +3)20 然后置 - Vp 2 


+ r ， 其中必要时加上的 0< r <2 — 2 ^_ ] 是为了舍入使它是 2 — 广 1 — 1 的 
倍数。最后置 A + 1。 

R 3 .[测试结束否]如果/< 〃，则返回步骤 R 2; 否则，本算法终止。 ■ 


这个算法是根据 S . A . Cook 的一个提议给出的。一项类似的技术已经用到计 

算机的硬件上[见 Anderson ， Earle , Goldschmidt 和 Powers , IBM J . Res . Dev . 11 

(1967),48 〜 52]。 当然，有必要十分小心地校验算法 R 的精确性，因为它可能非常 
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接近于不精确。我们在步骤 R 2 开始和结束处，将用归纳法证明 

z ^2 和 |z — 1/幻|<2 2 (55) 

为了这个目的，设心 = 其中&是步骤 R 2 进行第々次迭代之后 z 的 

值。为了开始对 々的归 纳法，我们有 

= ll v - 8/ 1/ 十 (321 V’ — l _32/ t /」)/4 = + rj 2 

其中 = ( t ;! i ; 2 t ; 3 ) 2 ， ％ = ( _ 8 t ; , 使得—士< ， 以及 (X 72 < 因此 


8 。 |< 士。 现在假设 (55) 已经对々验 证了； 则 


现在 

而且 


^ + 1 =1/ 幻 - z k + [ = 1/v - z k ~ Z k (l - z k V k ) - r = 

^ - ^(1 - z k v) - z 2 k (v - V k ) ~ r = 

d k - (1/v - S k )vd k - z 2 k (v - V k ) ~ r = 
vd 2 k - z 2 k (v - V k ) - r 

0 < < 的 <(2- 2 V = 2_? +1 


- 是 + 1 惫 +1 / N 走十 1 

0< z 2 (v ~ V k ) + r < 4(2 -2 _3 ) 十 2— 2 - 1 = 2 -2 

所以1心 + 1 1<2 _/ + 1 。我们仍然必须验证 （55) 的头一个不 等式； 为证明％ + 1 <2,有 
三种 情况： 



b ) V ^ 





z k = 2，所以 2 z 厂 z \ V k ^2 - 2 — 2 


o 


c)K — 〆 如则以 + 1 = 1/。-心 + 1 <2-2- 2 … <2,因为 ^>0 o 

算法 R 的运行时间以 

2T(4t2) 十 2T(2n) 十 2T(n) + •- + O(n) 

步为界，其中： TU ) 是为进行72位数乘法所需时间的上界。如果对于某个单调非递 
减函数 /( n )， T ( n ) 有 n /( n ) 的形式，则我们有 

T(4n) + T (2 n ) + T (”） 十 … < T (8 n ) (56) 

所以除法可以用与乘法相当的速度进行，只差一个常数因子。 

R . P . Brent 已经证明，如果乘？ 2 位数花费 M ( tz ) 个时间单位，则像 log x ， exp :c 
和 arctan x 这样的函数可以在 0( M ( n ) log n ) 步内求到 n 个有效位[ JACM 23 
(1976), 242 〜 251]。 


E . 实时乘法 如果 n 位数的乘法可以仅仅在72步中实现，那自然是很妙的。 
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我们已经从 T 2 2 阶降低到 / Z 阶，所以也许我们能把时间压缩到绝对极小值。事实 
卜.如果我们离开通常的计算机程序设计领域，并且允许构造有 无限多个全部一起 

动作的部件 的计算机，则确实有可能如我们输入数字那样快地输出答案。 

自动机的线性迭代阵列是一组设备 M ^ M ^ A ^， …，在计算的每一步，它们每 

一个都可处于一个有限状态的集合中。诸机器 M 2 ， M 3 , …全都有相同的线路，而且 

它们在时间 r + 1的状态是它们自己在时间〖的状态以及它们的左邻和右邻在时间 
t 的状态的函数。但头一台机器 iV ^ 稍微不 同：它 在时间 t + l 时的状态是它自己和 

M 2 在时间 r 的状态，以及在时间 z 时的输入的函数。一个线性迭代阵列的输出是 


个定义在的状态上的函数。 


设 


U 


U 


设 


UV 



9 


UJ 


U l U 0 ) 2 yV = ( V, 

t W 2 n - l --ZV { ZVQ) 2 o 


厂* 和 Q = ( Q n - i ^' QiQo )2 是二进数，并 

个值得注意的事实是，可以独立于〃，构造 


个线性迭代阵列，如果在时间 0，1 ，2,…时给定输入 （ wo ，叫， go ) ， （ q ，％， ) ， （ w 2 ， 


1^,92) ，…，它将在时间1，2,3,…输出加2，*"。 

我们可以用计算机硬件语言来叙述这个现象。为此只需指出有可能设计具有 
如下性质的一个集成线路模 块：如 果我们在一条直线上把充分多的集成片绕接在一 
起，让每一个模块仅与它的左邻和右邻通信，则得到的线路将恰在 2n 个时钟脉冲内 
产生 w 位数的 2n 位乘积。 

其基本思想可如此 理解： 在时间 0 ,机器 M , 读出 Uo ，^，^)， 因而它能够在时 
间 1 输出 （ UqVq + qo ) mod 2 。然后在时间 2 它看到 （ wr : gt ) 而且它能够输出 
( Wq *^1 + W 1 '^0 + 1 + k ) mod 2 ,其中々是由上一步留下的进位。其次它看到 U 2 , 

) 并输出 ( uqV 2 + UiVi ~\- U 2 Vq + 十々2) 2;而且，它的状态保持心 和以 2 

的值，使机器 M 2 能够在时间3读这些值，并且能够计算以便在时间4获 

益。机器 iV ^ 实质上安排来启动 M 2 乘序列（〃 2 ，巧），（〃 3 ， 1 ； 3 ), —，而]^ 2 最终将给 

M 3 以乘 U 4 ，％), U 5 , m ) 等等的工作。幸而，诸项事务是在丝毫不损失时间之下 

完成的。读者将发现，从下面简略的描述中进一步推导它的细节是有趣的。 

每个自动机有 2 U 个状态 

0 ，工 0 ，夕 0 ，：^，： Vi ，： r ，夕，之 2 ， 之 1 ，之 0 ) 

其中 0< c <4, 而且诸工、诸 3 ；和诸 z 的每个或是0或是1。开始时，所有设备都处 
于状态( 0 , 0 , 0 , 0 , 0 , 0 , 0 , 0 , 0 , 0 )。假设一台机器> 1 ，在时间〖处于状态 （ C ， 

工 0 ， ： vg ，工 I， ：y 1 ， n ，％ I ，以 ） ，而此时它的左邻碼 - 1 处于状态 （ ^， A ， V 。，工 Wi ， 

它的右邻 M ; + I a 于状态 

机器 Mj 将在时间〖十1进入状态 （c , yy ， z 2, 之1，之 0) ， 其中 

c = min ( c + 1，3),如果 d = 3，否则0 

(4,‘）二 （ x z ， y )， 如果 c = 0,否则 （ x Q ，： y 。） （57) 

( x \ , 3 ^ 1 ) = ( xW )， 如果 c = 1 ，否则 （ JC! ， m ) 
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(x , y ) = (: ，y) ，如果(： > 2,否则（: c ,3；) 

而且 （dzidh 是对于 



xy 



^ oy l 

^ oy l 


+ ^ l yo 


+ + ^ l yo 


如果 c = 0 
如果 c = 1 

如果(：= 2 


.^ oy l + x iy + x y \ + 如果 c = 3 


(58) 


的二进记号。最左边的机器的动作几乎和其它机器 相同； 当它接受输入“， t；， 

(7) 时，它的动作就好像在它左边有一机器处于状态（3,0,0,0,0，〃，^9,0,0) — 样。 
阵列的输出是的 zo 部件。 


表2示出了这个阵列在输入 

u = v = (…00010111 ) 2 ， q = (•■•00001011) 2 

时的动作的一个例子。输出序列出现在的状态的右下 部分： 


0 , 0 , 1 , 1 , 1 , 0 , 0 , 0 , 0 , 1 , 0 ,-* 

从右到左表示数（…01000011100)2。 

这个构造是以和 A.J.Atmbin 首先发表的论文相类似的思想为基础的，见 ffiEE 
Trans . EC-14 (1965) ，394 〜 399。 

这确实很快，但仅当输入的二进位在同一个时间抵达时这个迭代阵列才是最优 
的。如果输入的二进位全都同时出现，我们喜欢并行的线路，它在延迟 0(log n) 层 

次之后将得到两个72个二进位数的乘积。这类有效的线路已经由比如说 C.S. Wal¬ 
lace, IEKE Trans. EC-13 (1964) ，14〜17 ;D. E. Knuth，77ie Stanford GraphBase (New 

York：ACM Press ， 1994),270 〜 279 所描述。 

S.Winogradl/ACM 14 (1967),793 〜 802] 考察了当给定 tz 且可同时一齐利用 
任意代码形式的输入时，在一条逻辑线路中可达到的极小乘法时间。当必须同时支 
持乘法和加法时，关于类似的问题，也见姚期智 （A.C.Ya 0 )，STOC 13 (1981),308 〜 
311; Mansour，Nisan 和 Tiwari，STOC 22 (1990) ，235〜243。 


表2在线性迭代阵列中的乘法 


时间 

输入 

模块 iVTi 

模块 iVf 2 

模块 ivr 3 

■ 





■ 





1 

卜 

^ \ °0 1 1 

0 ^ ^ 0 

n 0 0 0 ^ 

u 0 0 0 Q 
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___ (续) 

时间 n 输 A 模块从 模块 M 3 ~~ 



Multiplication is mie vexation , 
And Division is quite as bad ； 
The Golden Rule is mie stumbling stule^ 

And Practice drives me mad. 

乘法是我伤脑筋的事， 
而除法也一样很坏: 
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黄金规则是我的姅脚石, 

而实践使我发疯。 

—MANUSCRIPT COLLECTED BY J. 0. HALLIWELL(c. 1570) 

习题 

1. [22] 如果以十进制代替二进制， （2) 中表达的思想可以推广成十进系统。试利用这个推 
广，计算1234乘以 2341( 把这个四位数字的乘积归结成两位数字的数的三个乘积，再把每个两位 
数乘积归结成一位数字的乘积）。 

2. [M22] 证明在算法 T 的步骤 T1 中，当我们置 i? —LM」 时，尺的值或者保持相同，或者 
增加 1( 因此，像在该步骤所看到的一样，我们不必计算平方根）。 

3. [M22] 证明当々>0时，算法 T 中定义的序列 q k 、 r k 满足不等式 2 q ， 、 (2 r h X 2 q k-i + %。 

► 4 . [28 ] (K. Baker) 证明，在点 ：c= - r， …， 0, …， r 处（而不是像算法 T 中那样在点 x =0,1, 
…， 2r 处）求多项式 W(x) 的值是有利的。多项式 L/U) 可以改写成 

U(x) - U e (x 2 ) + xU 0 (.r 2 ), 

类似地， VU ) 和也可以这种方式展开。说明怎样利用这一思想，以便在步骤 T 7 和 T 8 得 
到更快的计算。 

► 5. [35] 证明如果在算法 T 的步骤 丁1 处，我们置尺 —LVM」+ 1 以代替尺 — L/5」， 并给 

和 r i 以适当初始值，则 （21) 可被改进成 t k ^ q k + lg ^ + t (lg q k + i )o 

6.[M23] 证明 （24) 中的六个数两两互素。 
l.[M23] 证明（25)。 

8. [ M20 ] 正确或错误：在 （39) 中我们可以忽略二进位的反序 （ & _ •! ，… ，: ^) — (M ， …，〜 - 1 ) ， 

因为无论如何逆傅里叶变换将再次把这些二进位逆过来。 

9. [M15] 假设以V代替的所有出现，应用正文的傅里叶变换的方法，其中 g 是某个固定 
的整数。求由这个一般过程得到的数（“，&， … An) 和当(?-1时得到的数（心， 心，… 4^) 

之间的一个简单关系。 

10. [M26] (43) 中的调整使我们清楚地看到，在 Schdnhage-Strasseri 乘法算法计算心和％期 

间，由变换子程序的趟 7 计算的所有复数 A U] 的绝对值将小于证明在第三次傅里叶变换 
(^ r 的计算）期间所有 Ab_ ] 的绝对值将小于1。 

► ll.[M26] 如果《为定值，在由 （57) 和 （58) 定义的线性迭代阵列之下为计算^位二进数的 
乘积将需要多少个自动机？（注意，自动机碼只受它右边的机器的分量4的影响，所以每当输 

人是 n 位二进数时，我们可以去掉其 q 分量总为0的所有自动机。） 

► 12.[M4J ](A.Sch6nhage) 本题的目的是证明指针机器的一个简单形式可以在 O( n ) 步内乘 
n 位二进位数。这个机器没有用于算术的内部设备；它的所有工作都是处理节点和指针。每个节 
点有相同的有限个数的链接字段，并有有限多个链接寄存器，这个机器可以做的仅有操作是： 

i) 输人一个二进位，如果该位为0则 跳转； 

ii) 输出0或1; 

iu) 以另一个寄存器的内容或者以一个由寄存器指向的节点中的链接字段的内容装入〃个寄 
存器； 

iv) 把一个寄存器的内容存人到由一个寄存器指向的节点的一个链接字 段中； 
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v ) 如果两个寄存器相等，则 跳转； 

Vi ) 建立一个新节点并使一个寄存器指向它； 

vii ) 停止 Q 

试在这样一台机器上有效地实现傅里叶变换的乘法方法。[提示：首先证明，如果 N 是任何正整 
数，则有可能建立 N 个节点表示整数…，1，…，1!，其中表示 P 的节点有指向表示 P + 1， L " 
2」和的节点的指针。这些节点可以在 0( N ) 步内建立。说明现在模拟 N 进制的算术毫无困 
难 ：例如 ，给定指向 P 和 g 的指针，则可花费 0 (log N ) 步来找 （ p + g ) mod N 的节点并且确定是 
否 /) + 而且乘法可以在 OGog . V ) 2 步内模拟。现在考虑正文中的算法，其中々= Z 和 m = 

6 k 及 N 二 2 U ,11 ' 使得在定点算术计算中的所有量都是~进制的13位整数。最后，利用下边的 
思想，说明快速傅里叶变换的每一趟可以在 0 (K + (N log /\0 2 ) = 0(/0步内 完成； K 个必要的 
赋值的每一个可以被“编译，，成字大小为 N 的类似 MIX 的模拟计算机的有限指令表，且若 K 个这 
样机器的指令首先被排序，使得所有相同的指令可被一起实现，则并行运行的这些机器的指令 
可以在 0 (K + (/V [og A /) 2 ) 步内被模拟。（如果两个指令有相同的操作码，相同的寄存器内容，以 

及相同的内存操作数，则这两个指令相同。）注意，乂 2 = 0(” 12/13 )，所以（~ lo § ^) 2 =0( K ) o ] 

13 . [ M 2 5 ] ( A . Schonhage ) 当？？ z 和都非常大但”比肌大得多，根据本小 " P 对州=所证明 

的结果，试说明什么是一个777位数乘以一个”位数所需要时间的好上界？ 

U .[ M 42] 写出算法 T 的一个程序，并加入习题4的改进。试把它同算法 4.3.1 M 的一个程 

序及以 （2) 为基础的一个程序做比较，看看〃必须多大才能使算法 T 真的成为一个改进。 

15. [ M 49]( S . A . Cook ) 如果第々位输出产生之前不从右到左地读入诸操作数的第々+ 1位输 
入，则说一个乘法算法是联机的。问什么是在各类自动机上可以实现的最快联机乘法算法？ 

► 16. [25] 证明，即使当 K 不是2的一个乘幂时，为计算离散傅里叶变换（35)，只须花费 

0 (K log K ) 个算术运算。[提 示：把 （35) 重写成形式 
并把这个和表达成一个卷积。] 

17. [ M 26] Karatsuba 的乘法方案 （2) 做个一位的乘法，当它形成”位数的乘积时，其中 
K , = 1， K 2 „ 二 3 K ” ，以及 K 2tl + l -2 K n+l + 当 ” =2 e i +2〜+ …+ 2〜，> e 2 > …〉 ~> 

0时，通过求对于的一个显式来“解”这个递推式。 

► 18.[ M 30] 当通过基于 (2) 的一个递归算法实现乘法时，试设计对中间结果分配内存的一个 
方案；给定两个 N 位整数 w 和每一个都在内存的 N 个连续的位置中，说明怎样来安排这个计 
算使得乘积出现在工作存储器的一个 （3 N + 0 (log N )) 位置的最低有效的 2 N 个位置中。 

► 19. [ M 23] 如果允许你来测试一个操作数是否小于另一个，说明如何以一个有界的运算个 
数来计算 wi mod m , 而这些运算须满足习题 3.2.1.1-11 的基础规则。“和 r 都是变量，但爪是 

常数。提示 ：考虑 （2) 中的分解。 

4.4 进制转换 

如果我们的祖先已经发明了用他们的两个拳头或八个手指计数进行算术运算， 
而不是用10个“数字”，则我们就不必为写二进制转换程序而操心了（而且也许我们 
根本不会去学那么多数系的知识了）。在本节，我们将讨论从一种进制的位置记法 
到另一进制的位置记法的数的转换；当然，在二进计算机上把十进制的输入数据转 
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换成二进形式，以及把二进答案转换成十进形式的时候，这一过程最为重要。 

A. 四个基本的方法二进-十进转换是所有操作中同机器最有关的操作之一， 
因为计算机设计师们一直在想不同的办法用计算机硬件来实现它。因此，我们将仅 
仅讨论有关的一般原理，从这些原理出发，程序员可以选择最适合于他的机器的过 

程。 

我们假定待变换的数都是非负的，因为符号的处理很容易解决。 

假定我们正进行从6进制到 B 进制的转换（习题1和2中考虑混合进制的推 

广）。大多数进制转换子程序都是以乘法和除法为基础的，并利用下列四个方案之 
一。 头两种方法适用于整数（即小数点在右边），其它方法适用于小数（即小数点在 
左边）。通常不可能 精确地 用一个有尽的 B 进制小数 （0. 1；^ L 7-2 … LT - M ) b 表达 

一个有尽的6进制小数 （0. u — lU - 2 - u - m \ 0 例如，分数 &有无 穷的二进表示 

(0.0001100110011 …） 2 。因此有时需要把结果舍入到 M 位的一些方法。 

•方法 la (利用6进制算术除以 B ) 给定一个整数 w ，我们可以得到它的 B 进 
制表示（… u 2 u x U 0 ) B 如下： 

U 0 = u mod B , U { = L w / B」mod B , L / 2 = LLw / B 」/ B」mod B ，…， 

当 L … LLw / B 」/ B 」，"/ B 」= 0 时停止。 

•方法 lb (利用 B 进制的算术乘以 6) 如果 w 有6进制的表示 （“„,••• ^“0)6, 
则我们可以利用 B 进制算术来求形如 

((…+ u m - i)b + .“）6 + u x )b + u 0 

的多项式 wJ 771 +…+ u\b + uq = u 的值。 

•方法 2 a (利用6进制的算术乘以 B ) 给定一个小数我们可以逐个得到它 
的 B 进制表 7 K (. u — i U -2 …） B 的诸数字如下 •• 

U — rLwB 」， U-2 = l \ uB \ B ], [ J _ 3 = L H wB 丨 B 丨 B 」 ，… 

其中 1 1 表示 x mod 1 — x — Vx \ 0 如果希望把结果舍入成位，则在计算了 U _ m 

之后，这个计算就可以停止，此时如果 \- r \\uB \ B ] … B 1大于^•，则[7_从应当加1。 

(但要注意，这可能引起进位的传播，这些进位必须加到 B 进算术形式的答案中来。 

因此在计算开始之前，加一常数 + B — M 到原来的数“更为简单。但当 + 不能 

像6进制数那样在计算机内精确地表示时，这可能导致一个不正确的答案。进一步 
要注意的是，如果，答案有可能舍入成 （1.00 … 0) B 。 

习题3表明如何推广这个方法使得 M 可变，恰好大到足以把原来的数表示到 
指定的 精度； 在这种情况下不出现进位的问题。 
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•方法 2 b (利用 B 进算术除以 6) 如果 M 有6进表 7 K (0. U - { U ^ 2 '" U - m ) b ^ 
们可以使用 B 进算术以下列形式 

— + u l - m )!b + ••- + u - 2 ) I b + U -')1 b 


来计算 w _ 2 6— 2 + … + 应该小心控制在除以6的过程中的截 

断或舍入误差，这些通常是可以忽略的，但不总是这样。 

总之，方法 la , lb ,2 a 和 2 b 给了我们转换整数的两个方法和转换小数的两个方 
法。而且，通过乘以或除以6或 B 的适当次幂，肯定可以在整数和小数之间进行转 
换，因此，当试图进行转换时至少有四种方法可供选择。 


B . 单精度转换 为了说明这四种方法，假定 MIX 是一台二进制计算机，并且假 
定我们要把一个二进制整数 z / 转换成为一个十进制整数，于是6=2和 B = 10。可 
把方法 la 编成程序 如下： , 

A 

ENTl 0 置 — 0 


LDX 
ENTA 
1H DIV 

STX 

INC1 

SRAX 

JXP 


U 

0 

=10 = 
ANSWER,1 
1 
5 

IB 


置 rAX 一 w 

( rA ， rX ) — ( LrAX / lO」，rAX mod 10) 
Uj rX 

j ^ j + 1 

r AX — r A 

重复直到结果为 0 ■ 



为得到 M 个数字，这需要 18 M + 4 个周期。 

方法 la 使用除以10的 除法； 方法 2 a 使用乘以10的乘法，所以它可能稍微快一 
点。但为了使用方法 2 a ， 我们必须处理小数，而这导致了一种有趣的情况。设 w 是 
计算机的字大小，并假定 W <10”< u ;。 通过做一次除法，我们可以求岀 g 和「，其中 

vuu — \^) n q + r , 0 ^ r < 10 n (2) 

现在如果把方法 2 a 应用于小数 U + l )/ w ， 则我们将在 n 步中得到^从左到右的诸 
数字，因为 


10 n 




10” _ r 

ZV 



(3) 


(这个思想是 P . A . Samet 给出的，见 Software Practice & Experience 1 ( 1971 ) , 93 ~ 

96 o ) 

下面是对应的 MIX 程序： 
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JOV OFLO 
LDA U 

LDX = 1(T = 

■ 

DIV =： 1(T = 
JOV ERROR 
ENT1 ?i - 1 

2H MUL = 10 = 

STA ANSWER ， 1 
SLAX 5 
DEC1 1 
JINN 2B 


确保溢出开关断开 
rAX — + 10” 

rA g + 1, rX r 

如果 w > 10 w 则跳转 

置 J — 72-1 (4) 

现在想像小数点在左边， rA = 工 

置 Uj <- Lio ： c 」 

x 1 10:c| 

j —j - 1 

对 n > _； >0重复执行 ■ 


这个程序稍长一点，需要 16 rz + 19个周期，所以如果77 = M >8, 它比程序 （1) 稍快 
些； 当存在前导0时， （1) 将更快些。 ' 

当 icr < w<icr + 1 时，目前的程序 （4) 不能用来转换整数，因为我们需 
要取 M = w + l 。 在这种情况下，通过计算 LW 101 我们可以得到^的前导 数字； 然 
后当 n = m 时，〃 modl(T 即可如同上边那样进行转换。 

从左到右地得到答案数字这一事实在某些应用中可能是一个优点（例如，当一 
次打岀答案的一位数字时）。于是我们看见，尽管使用不精确除法时要附带做一点 
数值分析，但它可以使分数方法能用来进行整数的转换。 

对方法 la 做修改可以避免除以10,办法是用两个乘法来代替它。这个修改是 
重要的，因为进制转换通常是通过没有除法能力的小的“卫星”计算机完成的。如果 
: T 是1/10的一个近似，使得 



那么容易证明（见习题 7) Li ^ 


Wio 」 或 Lw / io 」 +1，只要 w 


因此，如果 


计算 w - lOL ^」， 我们将有能力确定 LW 10」 的值: 


u/10j 


一 [a < 10 _ 


ux 




⑸ 


同时我们还将确定 w mod 10 


利用 （5) 进行转换的 


个 MIX 程序出现在习题 8 中， 


对每位数字它要求大约33个 周期。 

如果计算机在它内部的指令系统中既无除法也无乘法，如同习题9中所说的那 
样，通过审慎地进行移位和加法，我们仍然能使用方法 la 来进行转换。 

从二进制转换到十进制的另一个方法是使用方法 lb ， 但为做到这一点我们需 
要在一个十进数系中模拟加倍。这个方法一般来说最适合于加到计算机硬件 中去; 
然而如表1所示，利用二进加法、二进移位及二进抽取或屏蔽（在寄存器中对每一位 
进行“逻辑与”），即可把十进数的加倍过程编成程序，这是由 Peter L . Montgomery 
提出的。 
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表 1 

加倍一 A 二进编码的十进数 


运算 


一 般形式 


例子 

1 .给定的数 

^11 以 10 

Ug Ug U-j U5 U 4 U 3 U 2 U y 

UQ 

0011 0110 1001-369 

2. 每个数字加 3 

^10 

V 9 V 1 V 6 V 5 ^3 ^2 

^0 

0110 1001 1100 

3 .抽取每个高二进位 

0 

0 0 巧 0 0 0 0 0 

0 

00001 0001 000 

4 . 右移两位和减 

0 ^ii 

^11 0 I ；7 0 0 ^3 X»3 

0 

0000 0110 0110 

5 .加上原来的数 

W 11 W )Q ZL* ^ ZL^ -J 1 L ' ^ ZV ^ ZV ^ XV y XV 2 ^ 1 

加 0 

0011 1 J 00 1111 

6 .加上原来的数 

上 U 上 11 

x 10 x 9 jt 8 t 7 . r 6 x 5 : r 4 x 2 x x 

工 u 

0 0111 0013 1000-738 


当0<^<4时这个方法把每个数字 d 改变成为 2d , 而当 5 <^< 9 时，改变成 
为 6 + 2d = (2d- 10) 十2 4 ;对于用4个二进位编一个数字的十进数来说，这刚好是 
加倍所需要的。 

另外一个有关的思想，是记住十进形式下 2 的乘方的一张表，并且通过模拟十 

进加法来把适当的乘方加到一起，在 7.1 节中有关于位处理技术的综述。 

最后，甚至方法 2b 也能用于二进整数到十进整数的转换。我们可以像在 （ 2 ) 中 

那样求而后模拟 g + 1 除以 w 的十进除法，办法是利用一个类似于刚才描述的 

加倍过程的“取半”过程（习题 10 )，且仅仅保留答案中小数点右边的头几位。在这 

种情况下，方法 2b 似乎并不比已经讨论过的其它三种方法有什么优点，但我们已经 

确认了早先所做的说明，即对于从一个进制到另一个进制的整数的转换，至少有四 
种不同的方法可以利用。 

现在我们考虑十进-二进转换 （6 = 10 ， B = 2 )。 方法 la 模拟除以 2 的十进 除法; 
这是能行的（见习题 10 )，但它主要适合于做成硬件，而不是编成程序。 

在绝大多数情况下，方法 lb 是进行十进-二进转换最实用的方法。下面是它的 
mix 代码，其中假定在被转换的数 ••心 中至少有两位数字，并假定 1(r + i 

<功，使得溢出不成为 问题： 

ENTl M - 1 置 j — m—l 

LDA INPUT + M 置 U — u m 
1H MUL = 10 = 

SLAX 5 (6) 

ADD INPUT ， 1 L7 — 10 L/ 十 

DEC1 1 

JINN IB 对于说重复 ■ 

乘以 10 可由加法和移位代替。 

习题19中描述了一个更复杂但或许更快的方法，它使用了大约 lg m 个乘法、 
抽取和加法，而不是 m - 1 个乘法和加法。 

对于十进小数 ( 0 . 二进制的转换，我们可以使用方法 2b ; 或 

者更一般地，我们可以通过方法 lb 转换整数 （ w 」 w _ 2 ) 10 ，然后除以 10 w 。 
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C •手算 计算机程序员偶尔也有必要用手算来转换数，由于这是在小学未曾讲 
过的一个课题，因此可能值得在这里简单地考查一下。有一些非常简单的手算方法 
可进行十进制和八进制记号之间的转换，这很容易学会，所以应当广为普及。 

八进制整数转换为十进制 最简单的转换是从八进制到十 进制； 这个技术看来 
首先是由 Walter Soden 发表的，见 Mai Comp . 7 (1953) ，273〜274。为了进行这种 

转换，写下给定的八进整数，然后 在第々 步利用十进算术加倍前6个前导数字，并利 
用十进算术从々+ 1个前导数字减去这数。如果给定的数有 m + 1位数字，则这个 
过程终止于 m 步。如同这里给出的例子那样，为了防止产生使人烦恼的错误，插入 
一个小数点来说明加倍哪些数字乃是一个好的想法。 

例 1把 （5 划51幻） 8 转换成十进制的数。 

5.3 2 5 1 2 1 
- 10 

4 3.2 5 1 2 1 
- 8 6 

3 4 6.5 1 2 1 

- 6 9 2 

2 1 1 3.1 21 

- 5 5 4 6 

2 2 1 8 5.2 i 

一 4 4 3 7 0 

177482」 

- 3 5 4 9 6 4 ' 

1 4 1 9 8 5 7 答案：（1419857) 10 

对于这些计算的一项相当好的检验，可以通过“去9”方法给出。十进数数字的 
和必须模9同余于八进数数字的交替的和与差，且后者的最右边数字应给成正号。 

在上述例子中，我们有1+4 + 1 + 9 + 8 + 5 + 7 = 35,以及 1-2 + 1- 5 + 2- 3 + 5 

二-1， 因此差是 36(9 的倍数）。如果这项测试失败，则它还可以应用到第々步之 
后的6 + 1个前导数字，而且利用一个“二进检索”程序，可以确定出错的 位置； 换句 
话说，通过首先检验中间结果，然后依据中间结果是正确还是不正确，把同一过程使 
用于这个计算的头一半或第二半去，可以找出错误的位置。 

当然，“去9”过程仅仅有89%的可靠性，因为有九分之一的可能出现两 个随机 
整数相差9的一个倍数的情况。一个更好的检验是使用求逆方法，把答案转换回来 
成为八进制数。我们现在就来考虑这个方法。 

把十进制整数转换成八进制 类似的过程可用来进行相反的转换 ：写下 给定的 
十进整数，然后在第纟步 利用八进算术 加倍纟个前导数字，并且利用 八进算 术把这 
些数字加到 A + 1个前导数字上。如果给定的数有 m + 1 个数字，这一过程将终止 
于 m 步 。 
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例 2把 （1419857) 1 D 转换成八进制的数。 

i .4 1 9 8 5 7 
+ _£ 

1 6.19857 

+ 3 U 

2 1 5 .9 S 5 1 

+ j 3 2 

2 6 1 3.8 5 7 

+ 5 12 6 

3 3 5 6 6.5 1 
十 6 7 3 5 J , 

Jt ， 2 5 2 i 1 .1 
+ 1 0 5 2 5 0 2 

5 3 2 5 1 2 1 答案：（5325121、 8 

(注意非八进制数字8和9进入了这个八进制计算中。）答案可如同上述的讨论那样 
进行校验。这个方法是 Charles P.Rozier 发表的，见 Trans . EC-11 ( 1962)，708 

〜709。 

刚才给出的两个过程实质上是一般进制转换过程的方法 lb 。 十进记号下的加 
倍和减法就好像乘以 10-2 = 8; 八进记号下的加倍和加法就好像乘以8 + 2= 10 o 
十六进制/十进制的转换有类似的一个方法，但它稍微麻烦些，因为它包含乘以6的 
乘法而不是乘以2。 

为了把这两个方法保留在我们的脑海中，不难记住，当从八进制转换成十进制 
时，我们必须做减法，因为一个数的十进制表示是更 小的； 类似地，当从十进制转换 
成八进制时，我们必须做加法。计算利用的是答案的进制，而不是利用给定数的进 
制，不然我们就不能得到所求的答案。 

转换小数 还没有发现用人工同样快速地转换小数的方法。最好的方法似乎 
是方法 2 a ， 并且用加倍和加法或减法来简化乘以10或乘以8。在这种情况下，我们 
把加法-减法的准则反过来，当转换成十进制时做加法，而当转换成八进制时做减 
法。在这个计算中，我们使用给定的输入数的进制，而不是答案的进制（见例3和 
4)。这个过程的难度大约是上述对于整数的方法的两倍。 

例 3把 （.14159) 1 Q 转换成八进制的数。 

•14159 
2 8 3 1 8- 

1.1 3 2 7 2 

2 6 5 4 4- 

i.O 6 1 7 6 

1 2 3 5 2 - 
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0.4 9 4 0 8 

9 8 8 1 6 - 
^.95246 
1 9 0 5 2 8 - 
7.6 2 1 1 2 
1 2 4 2 2 4- 

4.9 6 8 9 6 答案.乂 . 11037Jr..)& 

例4 将 （. n 0374) 8 转换成十进制的数。 

.110374 

2 2 0 7 7 0 

1.3 2 Jf 7 3 0 

651 660+ 

4.121160 

2 2 3 ^ 0 + 

U 5 4 1 4 0 

1 1 3 0 3 0 0 + 

5.6 7 1 7 0 0 
1563600 + 

8.5 0 2 6 0 0 
1 2 0 5 j 0 0 + 

6.2 S 3 U 0 0 答案 ：（. 141586…） 10 

D . 浮点转换 当要转换的是浮点值时，有必要同时处理指数和小数部分， 
因为指数的转换将影响小数部分。设要转换成十进制的数是广2%我们可以用 
10 £ 的形式来表达2穴通常借助于辅助表），而后把 F / 转换成为十进制。或者，我们 
可以用 b giQ 2 来乘 e ， 并把这结果舍入成最接近的整数£，然后 f 、 l e 除以 10 E ，并转 

换这个结果。反之，假定要转换成二进制的数是 F *10 £ ， 我们可以转换 F 而后以浮 
点数10 £ 来乘它（再次使用辅助表）。有一些现成的方法，通过利用若干乘法和（或) 
除法来减少辅助表的最大长度，尽管这可能引起舍入误差的传播。习题17考虑误 
差的极小化。 

E . 多精度转换 当转换极长的数时，最方便的是由转换数字块开始，这些数字 
段可以用单精度技术来处理，而后用简单的多精度技术把这些块组合在一起。例 
如，假设10” 是小于计算机字大小的10的最髙乘幂，则 

a ) 为把一个多精度整数从二进制转换成十进制，应反复地以10” 除它（于是用 
方法 U 从二进制转换成10” 进制）。对于10〃 进制表示的每一位单精度操作给出 n 
个十进数字。 

b ) 为把一个多精度小数从二进制转换成十进制，方法是类似的，乘以10” 即可 
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即对于 S = 10” 使用方法 2 a )。 

c) 为把一个多精度整数从十进制转换成二进制，首先转换 每块〃 个数字的诸字 
块，然后使用方法 lb 从 1( T 进制转换成二进制。 

d ) 为把一个多精度 小数从 十进制转换成二进制，如在 c ) 中那样，应首先转换成 
10” 进制，然后使用方法 2 b 。 

F •历史和文献 进制转换技术起源于古代处理重量、测量和货币的一些问题 
中 ，其中一般都涉及混合进制 系统； 通常都要编制辅助表来帮助进行转换。17世纪 
时， 当六十进制小数正为十进制小数所取代时，为了能使用天文数字表的现成书籍， 
有必要在两个系统之间进行 转换； 把小数从六十进制转换成为十进制及反过来的系 

统方法是在 William Oughtred 的 C/avis Mafiiematic 疋的1667年版，第6章，第18节 

中给出的（这个材料在1631年出的 Oughtred 的原版书中还未出现）。塔吉克斯坦 
撒马尔罕 （ Samarkand ) 的 al - K ^ shl 在他的 Key to Arithmetic ( 1427 ) 中已经给出一些 
转换规则，其中方法 la ， lb 和 2 a 已被清楚地说明 [ Jstonico - Maf . Issled . 1 (1954) , 

126 〜 135]，但他的工作尚不为欧洲人所知。18世纪美国数学家 Hugh jcmes 使用 

“ octavation ” 和“ decimation ” 两词来描述八进/十进转换，但他的方法不像他的术语那 
样聪明。 A . M . Legendre [ Tiieor/e des Nombres ( Paris : 1798)，229 ] 说明，如果反复地 
除以64,则正整数可以方便地转换成二进形式。 

1946年 ， H ■ H . Goidstine 和 J . von Neumann 在他们的经典的学术论文 Planning 
stnd Coding Problems for an Electronic Computing Instrument 中着重讨论了 进制转换 

冋题，因为有必要来论证使用二进制算术的正当性；见 John von Neumann ， Collected 
Works 5 ( New York : Macmillan , 1963 ), 127 - 142 0 关于在二进制计算机上进行转换 
的另 一 项早期的讨论是由 F . Koons 和 S . Lubkin 发表的，见 Maf / i . Comp . 3 (1949)， 
427〜431，其中他们提出了一个不太寻常的方法。关于浮点转换的第一次讨论是由 

F . L . Bauer 和 K . Samelson 在稍后 一 些时间给出的 \_ Zeit . filr angewandte Math , und 

Physik 4 (1953) ， 312 〜 316] 。 

类似地，下列论文有着历史 意义： G . T . Lake 的一篇笔记 [CACM 5 (1962) ，468 
〜 469] 提到了用于进行转换的一些硬件技术并且给出了一些清楚的例子。 A . H . 
Stroud 和 D . Secrest [ Comp . 6 ( 1963)，62 〜 66 ] 讨论了多精度浮点数的转换问题。 

能保留表示中所蕴涵的“有效位”个数的非规格化浮点数的转换问题，已由 H . Kan - 
ner \JACM 12( 1965 ) ,242〜 246] 与 N . Metropolis 和 R . L . Ashenliurst [ Mafh , Comp , 

19( 1965) ， 435 〜 441 ] 做了 讨论。也见 K . Slkdar y Sankhya B 30 (1968) ， 315 〜 334 及 
他的文章中引用的参考文献。 

P . J ‘ Plauger 在 TTie Standard C Library ( Prentice Hall , 1992) ,301 — 331 上给出 
了 C 程序设计语言中对于整数和浮点数格式化输入输出的详细的子程序。 
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► 1. [25] 推广方法 lb , 使它对混合进制记法有效，转换 bJo + …十 a^o + a 0 成为 
A ^ B M - 1 ." J B 1 B 0 + …+ A ! B 0 + A 。， 其中对于 ( Xj 〈 m ，( Xj 〈 M ， 有 Q ^ cij 〈 bj ,0^ A ； 〈 Bj 0 

给出你的推广的一个例子，通过手算来把量 “3 天， 9 小时，12分，37秒”转换成为吨，担，石，磅 
和盎司。（设1秒等于1盎司，英制的重量单位是1石=14磅，1担= 8石，1吨= 20担。）换言之， 
设 60 = 60，^ = 60,6 2 = 24 ，m =3， B G = 16,4 = 14， B 2 = 8，= 20 ， M = 4;问题是要使用推广方 

法 lb 的一个系统方法，求出适当范围里的 A 4 ，…，^，使得36 2 6!6 0 + 95^0 + 126 0 + 37 = 

A 4 B 3 B 2 B l B 0 + A 3 B 2 B l B 0 + A 2 B l B 0 + A , B 0 + A 0o (所有算术都要在混合进制系统下完成。） 

2.[25] 如在习题1中那样推广方法 la ， 使它对于混合进制记法有效。作为你的推广的举 

例，请通过手算解决如习题1中所述的同样的转换问题。 

► 3. [25]( D . Taranto ) 当对小数进行转换时 ，一 般没有明显的方法来判定在答案中应给出多少 
位。试设计方法 2 a 的一个简单的推广，使得 ：给定 0和1之间的两个正6进制小数“和 <，把 w 转 
换成舍入后的 B 进制等价数(7,这个 U 应在小数点右边有足够多的位数 M 位，以保证 I U ~ u \ 

< (o (特别是，如果 u 是6〜"的倍数且 （= 6 — ^2,则 L ； 的值将正好有足够的数字，使得当给定 U 

■ 

和 m 时，可以精确地把 w 重新计算出来。注意， M 可以是零。例如，若<<+且则正确 


的答案应是 U = l 0 ) 

4 . [ M 21 ] ( a ) 证明每一个具有有尽的二进表示的实数必有一个有尽的十进表示。 （ b ) 试求关 
于正整数6和 B 的一个简单条件，使得当且仅当每一个有尽的6进制表示的实数，也有有尽的 B 
进制表示时，它被满足。 

5. [ M 20] 证明若指令 “LDX 二 10” = ”被代之以对于某个其它常数(：的 “LDX = c = ”， 则程序 


(4) 仍将有效。 

6. [30] 当6或 J 3 是 - 2 时，讨论方法 la , lb ， 2 a 和 2 b 的使用。 

7. [ M 18 ] 假定 0< a < o:<a + l / w 以及 （X w ，其中 w 是 一 个整数，证明 Lw 」 等于 Law _ 
或 L ⑽」+ 1。而且，如果和 cT 1 是一个整数，则精确地有 L 似 」= Uu 」。 

8. [24] 写出一个类似于 （1) 的 MIX 程序，它使用 （5) 而且不包含任何除法指令。 

► 9.[ M 29] 本题的目的是当〃是一个非负整数时，仅仅通过二进制移位、屏蔽和加法运算来 
计算 w /10」 和 w mod 10。设 k ^2 是一个固定整数，并考虑计算 



Q 




v mod 16 , r ^— 





2 


使得 g / LWlO 」 或 mod 10的最小正整数 u 是多少？ 

10. [22] 表1示出如何通过在一台二迸计算机上使用各种移位、抽取和加法操作来把一个 
二进编码的十进数加倍。试给出一个类似的方法，它计算一个二进编码的十进数 之半。 （如果该 

数是奇数，则抛掉其剩余。） 

11. [16] 把（5?7幻） 8 转换成十进制。 

► 12. [22] 想出把整数从三进制记法转换成十进制记法的一个快速的手箅方法，并通过把 
(1212011210210); 转换成十进制来说明你的方法。你将怎样从十进制转换成三进制？ 
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► 13-[25] 假设单元 U + l，U + 2, …， U + m 包含一个多精度小数 （ . ^ w _ ,,,) 6 ，其中6是 

MIX 的字大小。试写出一个 MIX 程序，它把这个小数转换成十进记法，并把它截取成为180位十进数 
字。答案应打印成两行，而且数字9位一组，分成20块，每块用空白分隔开来（用 CHAR 指令）。 

► l 4.[ M 27]( A . Sch 6 nh age ) 当《很大时，正文中对多精度整数进行转换的方法要用，阶的 

执行时间转换一个《位整数。试证有可能在 O ( MU ) log 77) 步内把 n 位十进制整数转换成二 

进制记法，其中 M ( n ) 是为乘 n 位二进制数所需要的步数，它满足“光滑性条件” M (2 n )> 
2M(n) 0 

15. [M47] 在习题14中给出的转换大整数的时间上界，能否大大降低（参考习题 4.3.3-12)? 

16. [4]] 试构造一个从十进制转换成二进制的进制转换的快速线性迭代阵列（参考 4.3.3 E 
小节）。 

17. [ M 40] 试设计一个“理想的”浮点转换子程序，它把 p 位十进制数转换成 P 位二进制数， 
而且反过来也行，在两种情况下，都产生 4.2.2 小节意义下的真正的舍入结果。 

18. [ HM34 ] (David W . Matula ) 设 round 6 (“ ，/ >) 是在 4.2.2 小节的意义下6, w 和 p 的函数， 

它表示《的最好 p 位6进制浮点近似。在 b gi 3 6 是无理数及指数范围无限的假定下 证明： 当且仅 
当 B p ~ l > b p 时，对于所有 p 位6进制的浮点数 《， 

u = round 6 ( roundB ( u f P) % p) 

成立。（换言之，如同上面这个公式所描述的那样，对 《 做到一个无关的丑进制的“理想的”输入 

转换，接着再对这个结果做“理想的”输出转换，将总是再产生出 U 来，当且仅当中间的精确性 P 
是适当地大时。） 

19 . [ M23 ] 设十进数《 = ( w 7 … w ! m q ) 1 C ) 被表示成二进编码的十进数 L / = ( … w ! wo ) 16 。求 
适当的常数 c ,. 和屏蔽码 m ;， 使得对 i = l ，2,3, 重复的操作 L /— L /- C ; ( L 7 A m ,) 将把转换成为 
u 的二进制表示，其中“ A ”表示抽取（即按位的“逻辑与”）。 

4.5 有理算术 

知道某个数值问题的答案恰是1/3,而不是打印成 “0.333333574” 的一个浮点 
数，通常是重要的。如果以分数而不是以分数的近似来进行算术运算，则许多计算 
可以完 全没有任何累计舍入误差。 这就得到令人快慰的安全感。而通常在进行浮 
点计算时缺乏这种感觉，这意味着计算的精度不能再有所改进。 

4.5.1 分数 

当要进行分数算术时，可以把数表示成整数偶 （ W /)， 其中 w 和/互素，而且 
/>0。数0表示为(0/1)。在这种形式下，当且仅当 u = v 和时， = 
(vj V ’、 。 

当然，分数的乘法较为 简单； 为形成 U //) X ( viz /) = ( zWu /)， 我们可以简单 
地计算和 w ' z /。 两个乘积和 w ' t /可以不是互素的，但如果 d = gcd ( uv , 
u v ) , 则所求的答案就是 u ； = wt ;/ d ， w ’ = u ' v ’ I d (见习题 2)。4.5.2 小节讨论了计 
算最大公因子的有效方法。 

实施乘法的另一个方法是求 d ^ gcdU ，!/) 和 A = gcdU / ，^；) ; 于是答案是 U ， 
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二（“/义）（力/4)，‘ = (//4)(1；74)(见习题3)。这个方法需要计算两次 gcd , 

但它并不真比以前的方法慢；求 gcd 的过程包含一些实际上同它的输人的对数成比 
例的迭代，所以为计算 A 和 A 所需要的迭代总数，实际上和进行单个3的计算期 

间所需要的迭代总数相同。而且，计算 A 和 A 的每个迭代可能更快，因为要考察 

的数相对地比较小。如果 u , u \ v , t / 都是单精度的量，则这个方法就有这样一个优 
点，即除非两个答案 W 和切/全都不可能以单精度形式表示，否则在计算中不出现 

双精度数。 

除法也可以以类似的方式 进行； 见习题4。 

加法和减法稍微复杂些。 一 个显而易见的方法是，置 （ W /) 士 ( vlv ') 二 

( Uz / ± 然后如同在第一个乘法方法中那样通过计算 d = gcdiuv ' ± 

z / iz / z /)， 就可以把这个分数约简成最小的项。但是，如果我们从计算 A = 

gcd ( z /， t /) 幵始，则仍有可能避免处理这样大的数。如果4 = 1，则所求的分子和 
分母是 w = wz / ± z / r ； 和= / r / ( 按照定理 4.5. 2 D ，如果分母 z / 和 z / 随机分布， 
则 A 大约有61%的时间为1，所以把这一情况单独出来是明智的）。如果心>1， 

则设 t ^ u ( v ! d x )± W // A ) 并计算 A = gcdG ， A ); 最后答案是 w = tld 2 l w / = 

( i/ldWIcH (习题6证明 w 和的这些值是互素的。）如果使用单精度数，则 

这个方法只需要单精度运算，除非 z 可能是一个双精度数或稍大一些（见习题 7); 由 
于 gcd ( t , d x )~ gcd ( t mod ^ ， A ) ，故 c / 2 的计算不需要双倍精度。 

例如，为计算 （7/66) 十（17/12)，我们构造 A 二 gcd (66，12) =6;然后， =7.2 十 

17-11 = 201 和 A = gcd ( 201 ， 6 )= 3,所以答案为 （201/3)/(66/6 x 12/3) =67/44。 

为帮助校验有理算术的子程序，建议使用具有已知逆的矩阵（例如，柯西矩阵， 
习题 1.2.3-41) 的求逆。 

对于分数计算的经验说明，在许多情况下，数增长得十分快；所以如果打算使每 
个分数 U //) 中的 u 和/ 是单精度数，则重要的是要在每一个加法、减法、乘法以 
及除法子程序中包括溢出测试。对于某些数值问题，完善的精度很重要，因此在分 
子和分母中允许 有任意 精度的一组分数算术运算子程序是非常有用的。 

这一小节的方法也可扩充到除了有理数之外的其它数域中去；例如，我们可以 

对形如 （ w 十 w V 5 )/ w 〃 的量进行算术运算，其中 w ，/和 w 〃都是 整数， gcd ( u ， u’ ， u〃) 

=1， 且 w 〃>0; 也可以对形如 （w + w ' 方+ u"^~i ) /的量进行算术运算，等等。 

如果不坚持对分数进行精确计算，则考虑“幵缝定点 ” （fixed slash ) 和“开缝浮 
点 ” （floating slash ) 数是有趣的。它们类似于浮点数，但是以有理分数而不是以面向 

进制的分数为基础。在一个二进的开缝定点方案中，对某个给定的/>，一个可表示 
的分数的分子和分母都至多由0位组成。在一个开缝浮点方案中，对某个给定的 
c ?， 分子位和分母位的和至多为心而且这个表示的另一个字段用来指出这些9位中 
有多少属于分子。无穷可表示为（1/0)。为了对这样的数进行算术运算，我们定义 

工 ㊉: y = round (工+〜^:^: ㊀ 义二 round ( x ~ : y ) 等等，其中如果 x 可表 7 K ， 则 
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round (:^二:^否则它是围绕：?：的两个可表 7 K 的数之 一。 

乍一看， round (: r ) 的最好定义似乎是选择最接近于 x 的可表示数，就好像我们 
在浮点算术中进行舍人那样。但经验已经证明，最好使舍人偏倚于“简单”的数，因 
为有小的分子和分母的数比复杂的分数出现得更为经常。我们要求舍入成1/2的 
数比舍人成127/255的数更多。在实践中证明最成功的舍入规则称做“中间舍 入”: 

如果 U //) 和 （ W /) 是相邻的可表示数，使得每当时我们必然有 
round(:c ) 等于 ( w / ) 或 （W / ) ，则中间舍入规则指出： 


当 ： r < 



时 ， round ( x ) 



当 ： r > 



时, round ( x ) 



( 1 ) 

如果恰有 x = u + v)\u ^ t/) ，则令 rOU nd(：0 是具有最小分母的邻界分数（或者， 
如果/ = i /， 则为具有最小分子的邻界分数）。习题 4.5.3-43 说明，实现有效的中 
间舍入并不困难。 

例如，假设我们正在进行/> = 8的开缝定点算术运算，使得可表示的数 （ W /) 
有 -128< w <128 和 0< i /<256,且 w 丄这虽然不够精确，但足以给我们开缝 
算术运算的感觉了。相邻于0= (0/1) 的数是 （- 1/255) 和 （1/255); 因此，按照中间 
舍入规则，当且仅当 I | <1/256时我们将有 round ( x ) = 0 o 假设我们正在进行一项 


取整个形式为 f _ 



1300 

m3 


的计算，如果我们正使用精确的有理算术，但中间的 


量必须舍入成可表示的数。在这种情况下 


314 

y 159 


将舍入到（79/40)，而 


1300 

1 U 3 


将舍入成 


(7/6)，被舍入的项相加成为_ + | = _，它舍人成 （22/7); 所以尽管要求三次舍 

入，我们还是得到正确的答案。这个例子不是特别设计的。当问题的答案是一个简 
单的分数时，幵缝算术趋于使中间的舍入误差消失。 

在 P.Henrici 的著作中，首先讨论了一台计算机内分数的精确表示，见 /ACM 3 

(1956) ， 6 〜 9。 David W. Matula 在 S. K. Zaremba 编的 App"caf/orj o/ Number Theory 
to Numerical Analysis (New York：Academic Press ， 1972) ， 486 〜 489 中，提出 了开缝 
定点和浮点 运算的思想。 Matuia 和 Kornerup 在 Proc. IEEE Symp . Computer Arith . 4 
(1978)，29 〜 47 ;Lecture Notes in Comp . Sci . 72 (1979) ， 383 〜 397; Computing , Sup- 
pl.2 (1980),85 - 111 ； IEEE Trans . 032 (1983), 378 - 388 ； /E££ Trans . C 〜 34 
(1985),3-18;/EE£ Trans . 039( 1990) ， 1106-1115 中讨论了这一 思想的 发展。 


习题 

1. [15]提出一个用于比较两个分数的合理的计算方法，以测试是否 

2. [M15] 证明 ：如果 d = gcd(w，r)j!JWd 和 Wd 互素。 

3. [M20] 证明： w 丄 z/ 和 t ； 丄意味着 

gcd ( nv , u v ) = gcd ( u , i ；' ) gcd ( u f v) Q 
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4. [ n ] 试设计对于分数的一个除法算法，它类似于正文中的第二个乘法算法（注意，必须考 
虑 v 的符号）。 

5. [10] 试用正文中建议的方法计算 （17/120) + ( -27/70)。 

► 6 . [ M2 3 ] 证明 w 丄 / 和 u 丄 i / 意味着 gcd ( uv' + w 、 ， m ' z / ) = d ， 其中 d\ — gcd ( w ' ， z / ) ， 
d 2 = gcd(d [, u ( v \ d j ) + v{u \ d x)') o (因此，如果 A = 1 ， 则 uv + i/r 丄 z / t /。） 

I . [ M 22] 在正文中建议的加法-减法方法下，如果输入的分子和分母的绝对值都小于 iV ， 量 
t 的绝对值可变成多大？ 

► 8. [22] 试讨论利用 （1/0) 和（- L /0) 作 为〜和 - oo 的表示和（或）作为溢出的表示。 

9. [ M 23 ] 如果 1<^，丫<2\证明匕2 2 、//」=1_2 2 %//」意味着 u / t / = vlv \ 

10. [41] 推广习题 4.3.134 中提出的子程序，使它们能处理“任意”有理数。 

II . [ M 23 ] 考虑形如 （w + w )/ w ." 的分数，其中 u ， u ’ ， z /' 是整数 ， gcd ( w ， i / ， w 〃） = 1，且 w 〃 > 

0。说明如何迸行这样两个分数的除法并且得到有相同形式的商。 

U .[ M 16] 给定分子的长度加分母的长度的界问最大的有限开缝浮点数是多少？什么数 
舍入成 (0/1)? 

13 . [20] ( Matula 和 Kornerup ) 试讨论在一个32位字中的开缝浮点数的表示。 

14. [ M 23] 说明怎样计算使得和 / < N 2 且 u 丄 z / 的整数偶 U ， z /) 的精 

确个数。（这可以用来确定在开缝算术中有多少数是可表示的。按照定理 4.5. 2 D ，这个数将近似 
为 (6/ tt 2 )( M 2 - M ,)( N 2 - N ^ o ) 

15. [42] 修改你的计算机上的编译程序之一，使得它以幵缝浮点计箅代替所有浮点计算。 
通过运行现成程序来对开缝算术的使用进行实验，这些程序是由实际上已牢记浮点算术的程序 
员写成的。（当调用像开方或对数这样的特殊子程序时，你的系统在调用子程序之前，应当自动地 
把开缝数转换成为浮点形式，以后再回到开缝形式。应当有新的选择以分数格式打印开缝 的数; 
然而，如果对于用户的源程序不做修改的话，那也应该像通常一样以十进记法打印开缝的数。当 
开缝浮点数被替换时，结果是更好还是更糟？ 

16. [40] 试对开缝数的区间算术做试验。 


4.5.2 最大公因子 

■ 

如果 W 和是不全为0 的整数，则我们就说它们 的最大公因子 gcd (〃， iO 是同 
时整除 w 和 p 的最大整数。这个定义是有意义的，因为如果〃关0,则没有大于 M 
的整数可以整除《，但整数1整除 w 和〃 两者； 因此必定有同时整除两者的最大整 
数。当 U 和 I ;都为零时，每个整数都整除，所以上述定义不能 应用； 这时置 

gcd (0,0) = 0 (1) 

是方便的。 

刚才给出的定义明显地意味着 

gcd ( u , v ) = gcd ( z ;, u) (2) 

gcd ( u y v ) = gcd (- u y v ) (3) 

gcd ( u ,0) = \ u\ (4) 

在前一节，我们把以“最低项”表达一个有理数的问题归结为求它的分子和分母 
的最大公因子的问题。在 3.2.1.2 ，3. 3. 3，4. 3. 2 ,4.3. 3这些小节里，已经作为例子 
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提出了最大公因子的其它应用。所以最大公因子是重要的而且值得认真研究。 

两个整数“和 w 的最 小公倍 数写成 lcmUa )， 也是一个很重要的相关概念。 
它被定义为 w 和 r 的倍数中最小的正整数，而且 lcmU ，0) = lcm (0， t ;) = 0。 向孩子 
们讲授如何做分数加法 u \ U + 的经典方法是训练他们求最小公分母，这就是 

lcm ( w ' ， r ') o 

按照“算术基本定理”（已在习题 1.2.4-21 中证明了），每个正整数^均可表示 
成形式 

u 二 2\3^5'7 〜 in". = JJ (5) 

p 为素数 

其中指数心，〃 3 ,…是惟一确定的非负整数，而且其中除有限个指数外，其余皆为 

零。从一个正整数的这个“规范因子分解式”出发，立即得到计算〃和 I ；的最大公因 
子的一个方 法：由 （2)， （3) 和（4)，我们可以假定^和^都是正整数，而且如果两者已 
经规范地分解成素数因子，则我们有 

gcdU ， 幻 = IX p 咖 (vV (6) 

P 为索数 

Icmiu^v) = XX /> max( vV (7) 

P 为素数 

于是，例如以 = 7000 = 2 3 ,5、7 和 - 4400 = 2 4 *5 2 -ll 的最大公因子是 2 min ( 3 , 4 ) x 
5 min ( 3 , 2 ) x 7 min(I ， 0) x 11 麵 (0 ，。= 2 3 x 5 2 = 200 o 两数的最小公倍数是 2 4 x 5 3 x 7 x 11 
= 154000 。 

从公式 （6) 和 （7) ，容易证明有关 gcd 和 lcm 的一些基本的恒 等式： 


gcd( u ,v)vu - gcd( uw , vzv ), 如果 w > 0 (8) 

lcm( u ,v)vu — lcm( uw , zrw) ， 如果 (9) 

u • v = gcd( u ， v) • lcm( u ， v) ， 如果 (10) 

gcd(lcm( u ,v) ,lcm( u ,zv)) — lcm( u , gcd( v 7 w)) (11) 

lcm(gcd( ii ,v) ,gcd( u ,uj)) = gcd( u , lcm( v ,w)) (12) 


后两个公式是类似于熟知的恒等式 uv + uzv =w(^ + w) 的分配律。等式 （10) 把 
gcdUa ) 的计算归结成为 lcmU ， tO 的计算，而且反过来又把 lcm ( u ， T ；) 的计算归 
结为 gcd( u ， D) 的计算。 

欧几里得算法 尽管等式 （6) 从理论上说是有用的 ，但一 般说来它对于实际计 
算最大公因子并没有什么帮助，因为它要求我们首先确定 w 和 d 的规范因子分解。 
还没有已知的方法非常快地来求一个整数的诸素因子（见 4.5.4 小节）。幸而有一 
个不需要分解两个整数就能计算它们的最大公因子的有效方法。事实上，这样一个 
方法在2250多年以前就发 现了； 这就是“欧 几里得 ”算法，在 1.1 节和 1.2.1 小节我 
们就已经考察过了。 

欧几里得算法见于欧几里得的 E/ements —书（大约公元前 300 年）的卷 7, 命题 
1和2,但这大概不是他自己的发明。学者们相信这个方法大约在那之前200年就 
已经知道/，至少以它的减法形式，而且几乎肯定为 Eudoxus ( 约公元前 375 年）所 
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知；见 K . von Fritz ， Arm . Math. (2) 46 (1945) ， 242 〜246。 Aristotle 在他的 Topi ’ cs ， 

158 b ,29 〜 35 上也提到了它。然而关于这样早期历史的过硬证据幸存下来的极少 

[请见 W . R . Knon , T/ie Evolution of the Euclidean Elements (Dordrecht ： 1975) ] 0 

我们可以把欧几里得方法称做所有算法的祖先，因为它是今日幸存的最老的不 

寻常的算法，主要能与这一荣耀相抗衡的也许是古老的埃及的乘法方法，它是以加 

倍和加法为基础的，而且如同 4.6.3 节所说明的，它形成有效计算第”次乘方的基 

础。但是埃及的原稿仅给岀不是完全系统的一些例子，而且这些例子肯定未加系统 

阐述； 因此埃及的算法肯定配不上算法的名字。我们也知道用于诸如解两个变量的 

特殊二次方程组的若干古代巴比伦人的方法，其中包含了一些真正的算法，而不仅 

仅是对于某些输入参数的方程特殊解；尽管巴比伦人总是联系对具体的输入数据进 

行工作的例子来介绍每个方法，但他们总是有规律地伴随着正文来说明一般过程。 
[见 D . E . Kmith，CACM 15 (1972) ，671 〜677; 19 (1976) ，108。 ] 这些巴比伦算法中 

有许多比欧几里得算法早大约1500年，而且它们是已知最早的关于数学的书面过 
程的例证。但它们都没有欧几里得算法的气质，因为它们都不含迭代，而且还因为 

它们已为现代代数方法所代替。 

由于欧几里得算法从实用上和从历史上说都是重要的，现在就让我们考虑欧几 
里得本人是怎样处理它的。把他的话语译成现代术语，欧几里得所说的就是： 

命题 给定两个正整数，求它们的最大公因子。 

设 A 和 C 是两个绐定的正整数；求它们的最大公因子。如果 C 整除 A ， 则 C 就是 C 和 A 的 
一个公因子，因为它也整除本身。而且事实上显然它是最大的，因为再无比 c 大的数能整除 C 

了。 

但如果 C 不整除 A ，则不断地从 A 、 C 两数中之大者减去小者，直到得出整除前一数的某个 
数。这种情况最终一定要发生，因为如果得到的是1，则它就整除前一个数。 

现在设 E 是 A 除以 C 的正 余数； 设 F 是 C 除以£的正余数，而且设 F 是£的一个因子。由 
于 F 整除£和£整除 C - F , 故 F 也整除 C - F ; 但它也整除本身，所以它整除 C 。 而且 C 整除 A 
-^^因此厂也整除焱-五“旦它也整除£;因此它整除 A 。 于是它是 A 和 C 的一个公因子。 

现在论证它也是最大的。如果 F 不是 A 和 C 最大的公因子，则将有某个更大的数整除它们。 

设这样一个数是 G 。 

现在由于 G 整除 C 而 C 整除 A - £，故 G 整除 A - £，但也整除整个 A ， 所以它整除余数£， 
但 E 整除 C - F ; 因此 G 也整除 C - F ， 但 G 也整除整个 C ， 所以它整除余数 F ; 即，一个较大的数 

整除一个较小的数，这是不可能的。 

因此，没有大于 F 的数能整除 A 和 C ， 所以 F 是它们的最大公因子。 

推论 这一论证使得下列结论成为 显然： 整除两个数的任何数必整除它们的最大公因子。 
证毕。 

这里在一个重要方面简化了欧几里得的叙述：希腊数学家不认为1是另外的正 
整数的“因子”。两个正整数或者都为1，或者互素，或者有一个最大的公因子。事 
实上，1 甚至不 被认为是一个“数”，而且0当然是不存在的。这些相当笨拙的约定 
使得欧几里得有必要重复他的许多讨论，而且他已经给出了两个分开的命题，其中 

每一个实际上都同现在给岀的这个相类似。 
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在欧几里得的讨论中，他首先提出重复地从两个现有数的大者减去小者，直到 
我们得到这样两个数—其中一个是另一个的倍数为止。但在证明中，他实际上依 
赖于一个数除以另一个数的余数；由于他没有0的简单概念，故他不能说一个数整 
除另一个数时的余数是什么。所以可以合理地认为，他想像每个除法（不是个别的 
减法）都是算法的一个单一的步骤，因此对他的算法的“真正的”意译也许可以说是 

下面的算法。 

算法 E (原 始欧几里得算法） 给定两个大于1的整数 A 和 C ， 本算法求它们的 
最大公因子。 

E 1.[ A 可被 C 整除？]如果 C 整除 A ，则这算法以 C 作为答案终止。 

E 2 •[以余数代替 A ] 如果 A mod C 等于1，则给定的数互素，所以算法终止。 
否则，以 （ C，A mod C ) 代替 （ A ， C ) 并返回步骤 El 。 I 

上面摘录的欧几里得给出的证明，是特别有趣的，因为它实质上全然不是证明！ 
他只是实施步骤 E1 —次或三次验证了这个算法的结果。诚然，他必然认识到步骤 
E 1 可进行三次以上，尽管他没有提出这样的可能性。由于没有用数学归纳法给出 
一 个证明的思想，他仅仅对于有限种情况给出了一个证明（事实上，对于要求对一般 
的 n 建立的过程，他通常仅仅证明 n =3的情况）。尽管由于欧几里得在逻辑推导 
的技巧上所作出的巨大推进而应得地闻名于世，但通过归纳法给出正确证明的技术 
直到许多世纪之后还迟迟未被发现；而且证明算法正确性的严格思想，实际上直到 
现在才真正搞清楚(关于欧几里得算法的一个完备的证明，以及对于算法的一般证 
明过程的讨论，见 1 . 2.1 小节）。 

值得注意的是，用于求最大公因子的这个算法被欧几里得选来作为他发展数论 
的第一步。当今的许多现代教科书仍然沿用相同的讲述顺序。欧几里得也给出了 
一 个方法（命题 34) 来求两个整数 w 和 r 的最小公倍数，即以 gcd ( w ， z ；) 除 w 并且以 

v 来乘其结果，这等价于等式（10)。 

如果避免欧几里得对于0和1的偏见，则我们就可以用下列方式重新叙述算法 
E 。 

算法 A (现 代欧几里得算法） 给定非负整数 w 和 I 本算法求出它们的最大公 
因子（注 意：由 于等式 （2) 和（3)，任意整数 w 和^的最大公因子可以通过把这个算法 

应用于 M 和 M 得 到）。 

Al.[w = 0?] 如果 w = 0, 则本算法以 m 作为答案而终止。 

A 2 •[取 w mod v ] 置 r ^~ u mod —— r ， 并返回 Al 。 （这 一^步的操作 

减小的值，但保持 gcdU ，幻不变。） I 

例如，我们可以计算 （ 40902，24140 ) 如下： 

gcd (40902,24140) = gcd (24140 , 16762) = gcd (16762,7378)= 

gcd (7378,2006) = gcd (2000,1360)= 

gcd (1360,646) = gcd (646,68) = gcd (68,34)= 
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gcd (34,0) - 34 

如果 g 是任意整数，算法 A 的正确性的证明容易由等式 (4) 和 

gcd ( u y v) = gcd ( v , u ~ qv) (13) 

得岀。等式 （13) 成立，因为^和^;的任何公因子都是 W 和“- - 的一个因子，反过 
来，和 w - gt ; 的任何公因子也必整除 w 和。 

下列的 MIX 程序说明了算法 A 可容易地在一台计算机上实现。 

程序 A (欧几里得算法） 假设 w 和 w 是单精度的非负整数，分别存放在单元 U 
和 V 中； 这一算法把 gcdU ， W 置于 rA 中。 

LDX U 1 rX—u 

JMP 2 F 1 

1 H STX V T v^rX 

SRAX 5 T rAX—rA 

DIV V T rX—rAX mod w 

2 H LDA V 1 +T rA—r 

JXNZ IB 1 +T 如果 rX 二 0 则完成 ■ 

这一程序的运行时间是 19 了 + 6 个周期，其中 了是 实施除法的次数。 4.5.3 小 
节的讨论说明，当 w 和 I ；独立地 一 致分布于 ， v < N 的范围内时，我们可以取 
T = 0.842766 In N + 0 . 06作为一个近似的平均值。 

一 个二进制方法 尽管欧几里得手工算法已经沿用了这么多世纪，但它却不是 

求最大公因子的最好方法，这说来颇为令人惊讶。一个十分不同的主要适合于二进 
算术的 gcd 算法是由 Josef Stein 于1961年发现的[见爲 Comp . Phys . 1 (1967),397 

〜405]。这个新算法不要求除法指令。它仅仅依赖于下列运算：（0减法； （ H ) 奇偶 
校验； （⑴)偶数折半（它对应于在二进制表示中的右移）。 

二进制 gcd 算法基于正整数 w 和的四项简单 事实： 

a ) 如果“和 w 都是偶数，则 gcdUj ) =2 gcd “/2， W 2) [见等式（8)]。 

b ) 如果 w 是偶数而 w 是奇数，则 gcd ( u ， v ) = gcd ( W 2， w ) [见等式(6)]。 

c ) 如同在欧几里得算法中一样， gcd ( u ， v) = gcd ( u - z ;， I ；)[见等式（13)，（2)]。 

d ) 如果 w 和 t ; 都是奇数，则 u ~ v 是偶数，而且 I w r I < max ( u ， v ) 。 

算法 B (二 进制的 gcd 算法） 给定正整数 w 和本算法求它们的最大公因 
子。 

B 1 •[求2的乘方]置々—0,而后重复地置 k—k + l，u — ul2，v — vl2 共0次 
或多次，直到〃和 u 不都是偶数为止。 

B 2 •[初始化](现在 m 和 w 的值已经被除以2\而且它们现有值中至少有一 
个是奇数。）如果 w 是奇数，则置 - I ； 并转到 B 4。 否则 t^uo 
B 3.[^ 折半](这时 z 为偶数，而且非零。）置 t — 

B 4.[ t 是偶数吗？]如果〖为偶数，则转回 B 3。 
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B5 •[重置 max ( w ， xO ] 如果^>0,则置否则置和 t ; 之较大 

者已为 UI 所代替，除了或许在头一次实施这一步骤期间之外。） 

B6 •[做减法]置 t^*~u ~ 如果则转回 B 3 。否则本算法以 w • 作为 

输岀而终止 。I 



图9求最大公因子的二进算法 


作为算法 B 的一个例子，我们来考虑 w = 40902 ，r 二 24140,我们已经使用同样 
的数试验过欧几里得算法。步骤 B 1 置 6 — 20451 ，r — 12070, 然后， 被置为 

- 12070,继又被 - 6035所 代替； 然后■^被6035所代替，这一计算的过程如下： 


u 

V 

20451 

6035 

901 

6035 

901 

2567 

901 

833 

17 

833 

17 

51 

17 

17 


t 

+ 14416, + 7208, + 3604, + 1802, +901 ； 

- 5134, -2567； 

— 1666， - 833； 

+ 68,+34,+ 17； 

-816, -408, -204, - 102, -51; 

- 34， - 17 ； 

0 


答案是 17 X 2 l = 34。 这里有必要比算法 A 做稍多一点的迭代，但由于不使用除法， 
故每次迭代都比较简单。 

算法 B 的一个 MIX 程序仅仅比算法 A 多出一点代码。为使这样一个程序成为 
算法 B 的相当典型的一个二进计算机表示，我们假定 MIX 被扩充成包括如下一些运 

算符： 

• SLB ( AX 二进左移） C =6; F =6 q 寄存器 A 和 X 的内容被“左移” M 个二 进位; 
即 | r AX | — |2 M rAX|mod ，其中 J 3 是字节长（如同所有的 MIX 移位指令 
一 样， rA 和 rX 的符号均不受影响）。 

•SRB ( AX 二进右移） C =6 ，F = 7。 A 和 X 的内容被“右移” M 个二 进位； 即 I 
rAXl — UrAX |/2 M 」。 
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• JAE，JAO ( A 偶转移， A 奇转移） C =40 ;F 分别等于6,7。如果 rA 分别为偶或 

奇，则出现 JMP 。 

• JXE，JXO ( X 偶转移， X 奇转移) C =47 ;F 分别等于6,7。类似于 JAE ， JAO 。 


程序 B (二进制 gcd 算法） 假设 w 和 r 是单精度的正整数，分别存放于单元 U 
和 V 中；这一程序使用算法 B 把 gcd ( u ， tO 放进 rA 中。寄存器 分配： rA ^ 纟 ,rll = ^ 0 


01 

ABS 

EQU 

02 

B1 

ENT1 

03 


LDX 

Ob 


LDAN 

05 


JMP 

06 

2H 

SRB 

07 


工 NCI 

08 


STX 

09 


STA 

10 

1H 

JXO 

11 

B2 

JAE 

12 


LDA 

13 

B3 

SRB 

U 

B4 

JAE 

15 

B5 

JAN 

16 


STA 

17 


SUB 

18 


JMP 

19 

1H 

STA 

20 

B6 

ADD 

21 

2H 

JANZ 

22 


LDA 

23 


ENTX 

2J^ 


SLB 


1:5 

0 1 B 1. 求2的乘方 

U 1 rX— w 


V 

1 

IF 

1 

1 

A 

1 

A 

U 

A 

V(ABS) 

A 

B4 

1 +A 

2B 

B + A 

U 

B 

1 

D 

B3 

1 - B + D 

IF 

C 

U 

E 

V 

E 


rA ^ v 

rA ， rX 折半 

k^k + 1 

u^— u/2 

v—vl2 

若 m 是奇数则置转 B4 
B2 .初始化 

t — U 

B3.t 折半 
B4.t 为偶 ? 

B5. 重置 max( u ,v) 

若 t >0, 则置 u^t 

t^~u — v 


2F E 

V(ABS) C-E 若〖 <0 ,则置 

U C-E B 6 .做减法 

B3 C 若 / 乒 0, 则转 B 3 


U 1 r A— u 

0 1 rX—0 



rA—2 々 • rA | 


这个程序的运行时间为 

9A 十 2B + 6C + 3D + £ + 13 

个单位，其中 A = l 如果在步骤 B2 中心则 B = l( 否则 B = 0) ， C 是做减法的 
次数， D 是在步骤 B3 中折半的次数，而 £: 是在步骤 B5 中〖 >0 的次数。本节后边 
讨论的计算意味着，假定随机输入的 w 和是在 l<w ， t ； <2 n 的范围内，我们可以 

取 A = l/3，B = l/3，C = (h71JV-0.5，D = 1.41N —2.7 ，£： = 0.35N-0.4 作为对于 

这些量的平均值。因此总的运行时间大约为 8.8JV + 5.2 个周期，而在同样假定下 
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程序 A 大约需要 11.1 JV 十 7.1 个周期。当 A = Q，B = 1， C = N，D = 2 N -2， E 二 N 
-1 时，在这个范围内的^和^出现最坏的运行 时间； 总计为 13 N + 8 个周期（而对 
于程序 A 对应的值为 26.87V + 19)o 

因而，由于运算的简化，程序 B 中较快的迭代弥补了所需要的较大的迭代次数。 
我们已经发现，在 MIX 计算机上，二进算法要比欧几里得算法快大约20%。当然，在 
其它计算机上，情况可能有所不同，无论在何种情况下，这两个程序都是十分有效 
的。但是看起来，即使像欧几里得算法这样古老的方法，也经不起进一步的考验。 

二进最大公因子算法本身可能有一个著名起源，因为它在古老中国可能已广为 
人知。称做《九章算术》(约公元1世纪）的一本经典课本的第一章第六节'给出把 
一 个分数约简成最低项的下列 方法： 


可半者半之。 

不可半者，副置分母、子之数，以少减多， 
更相减损，求其等也。 

以等数约之。 


如果重复指令意味着回到折半步骤而不是重复减法步骤 


这点不清楚 


这个 


方法实质上就是算法 B 。 [请见 Y . Mikami ,The Development of Mathematics in Chi ¬ 
na and Japan ( Leipzig : 1913 ) , 11; K . Vogel , Neun Bucher arithmetischer Technik 
( Braunschweig ： Vieweg , 1968) ,8 0 ] 

V . C . Harris [Fibonacci Quarterly 8(1970)，102 〜 103; 也见 V . A . Lebesgue , 



. Math.Pures AppL 12 (1847) ,497 〜 520] 提出了欧几里得算法和二进算法之间的 
有趣交叉。如果 w 和 r 是奇数，并有则我们总可以令 



u = qv ± r 

其中 0< r < t ; 且 r 为 偶数； 如果 r 关0,则我们置 r — r /2 直到 r 为奇数为止，然后置 
w —U — r 且重复这一个过程。在随后的迭代中 


推广 我们可以把计算 g C d ( W ， t ;) 的一些方法推广，以便解决稍微困难些的问 


题 


o 


例如，假定我们要计算 n 个整数 Wl ， W2 ，- 
假定诸 w 是非负的，计算 gcdUi ，^ ，… 


參 麝 


u r , 的最大公因子。 


、）的 




个办法，就是以下列方式推广 



欧几里得算法：如果所有的义均为0,则最大公因子取为0;否则如果仅有一个 

非0,则它就是最大公 因子； 否则对于所有以％ mo d %代替 其中％ 是非 

的诸 W 当中的最小者。 

在上一段里描述的算法，是欧几里得算法的一个自然的推广，而且可以以类似 

方式论证其正确性。但是，还有一个更简单的方法可以利用，它以容易验证的恒等 
式 


gcd ( b 

为基础。为了计算 gcd ( 


u 2 



U 2 



= gcd(u l , gcd ( u 2 ，…， U n )、 

) ，我们可以按如下步骤进行 


(14) 


即《九章算术》方田章约分术。——本书责任编辑 
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算法 CU 个整数的最大公因子） 给定整数…，以，…，〜，其中；2>1，本算法 
利用 n =2时的一个算法作为子程序，计算它们的最大公因子。 

C1 •置 d 一 u n ， k — n - 1。 

C 2 .如果且々 >0 ，则置 gcd( 1^，<^)和々一々 _ 1并重复这一 ^ 步骤。否 

WO d = gcd( 〜，…， ) 。 I 

这个方法把 gcd( Wl ， …，的计算归结为重复地一次计算两个数的最大公因子。 

它利用了 gcd( w i ，…，~， 1) = 1 这个事实；这样做很有好处，因为，如果 心 -i 和 

是随机地选择的，我们将有60%以上的机会有 gcd ( u n - { , u n )^ lo 在大多数情况 

下，在前头几步的计算中 d 的值将急剧地减小，因而使得剩下的计算十分快。这里 
欧几里得算法相对于算法 B 有一个优点，因为它的运行时间主要地由 nun( 心 所 
支配，算法 B 的运行时间则主要是由 maxU，r) 所 支配； 合理的做法是，如果 w 比 w 
大很多，则宜于先实施欧几里得算法的一次迭代，以〃 mod I；代替^然后再以算法 
B 继续之。 

断定对于随机输入 gccK ^q，^) 将有60%以上时间等于1，是数论中下列著 
名结果的一个推论。 


定理 D ( G . Lejeune Dirichlet , Abhandlungen Koniglich Preu/^. Akad. Wiss. 

(1849),69-83 ) 如果 u 和 v 是随机地选择的整数，则 gcd(u ， v) = 1 的概率为 6/ tt 2 〜 


.60793。 

习题10给出了这个定理的精确公式及严格证明，该公式仔细定义了“随机地选 
择”的含义。眼下我们给出一个启发性的论证，它说明为什么这个定理是讲得通的。 

如果我们不加证明地假定 u 丄 w 的适当定义的概率 p 是存在的，则我们就可以 
确定对于任意正整数 d y gcd ( u y v ) = d 的概率，因为当且仅当 M 和。都是 d 的倍 
数，而且 U/d 丄 Wd) 时， gcdU，r) = d。 于是 gcd(u，i；) = d 的概率等于 lid mid 
乘/)，即 pM 2 。 现在我们对于所有可能的 d 值把这些概率加起来，就得到 



由于由式1.2.7-(7)，和数1 + | + |~+〜=]^ ( 00 2) 等于7： 2 /6，故为使这个等式成立，我 


们需要有 p = 61 n 2 


欧几里得算法可以另一种重要的方式加以推 广：我 们可以在计算 gcd(^ 
同时，计算整数/和/，使得 

uu + vv , = gcd( u y v ) 

欧几里得算法的这一推广，用向量记法描述比较方便： 


T；) 的 
(15) 


算法 X( 扩充的欧几里得算法） 给定非负整数和 t 本算法确定一个向 


写 


( U { y U 2 J W3) 使得 



VUi — ll 


gcd( 


U , V 


o 


这个计算利用辅助向量 （ ， ^2 ， 


v ^) ,( h 所有的向量都以这样 一 种方式操作，即在整 



计算过程中，如下关 
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Ut ^ ^ Vt 2 — ^3 


UU \ + VU 2 




以3， UV [十 VV 2 = ^3 


成立 


O 


XI - [初始化]置 — — 


^3 




0吗？] 


如果 


^3 


0,则此算法终止。 


X3 •[除，减] 


置 q — 


W/%」， 然后置 


(h ， t 2 ， t 3 ) — (u [y u 2 y U 3 ) - (VlyV 2 yV 3 )q y 


li l y ll2 y U 2^) 

返回步骤 X2 0 




V 


i ，。2,幻 3) ， 


V 


，卩 2 ，。3) 


< — 


( i 1 "2 ，, 


3 


(16) 


例如，设 w =40902,1； =24140。在步骤 X2 我们有 

q u 1 ui u 3 

- 1 0 40902 

1 0 1 24140 


1 

1 

- 1 

16762 

2 

— 1 

2 

7378 

3 

3 

-5 

2006 

1 

- 10 

17 

1360 

2 

13 

-22 

646 

9 

-36 

61 

68 

2 

337 

-571 

34 


幻 j 

幻 2 

^3 

0 

1 

24140 

1 

-1 

16762 

- 1 

2 

7378 

3 

-5 

2006 

- 10 

17 

1360 

13 

-22 

646 

-36 

61 

68 

337 

-517 

34 

-710 

1203 

0 


因此解答是337 x 40902-571 x 24140 = 34 = gcd(40902,24140) 0 

算法X可追溯到印度北方 Aryabhata 的 Aryabharrya (公兀499年）。他的描述 
是相当神秘的，但以后的诠释者如7世纪的 Bhaskara I阐明了这个规则。它被称做 

kuttaka (“粉碎器”）。[请见 B. Dana 和 A. N‘ Singh,History of Hindu Mathematics 2 
(Lahore:Motilal Banarsi Das, 1938) ， 89 〜 116。] 它的正确性由 (16) 和下述事实得出: 


就 W3 和％的操作而言，这个算法同算法 A 是相 同的； 1.2.1 小节讨论了算法X的 
详细证明。 Gordon H. Bradley 已经发现，我们可以去掉 w 2 ，t ; 2 和来避免算法 X 
中的大量计算；然后再利用关系式 uu I + VV 2 = w 3 来确定 “2。 

习题15表明 ， Iwd y \ U 2 \ y\ V\ \ ，| t ^ l 的值被输人 W 和 W 的大小所界囿 D 算法 B 

利用二进制记法的性质计算最大公因子，它可以以类似的方式被 推广； 见习题39。 
关于算法 X 的某些有教益的推广，见 4.6.1 小节中的习题18和习题19。 

奠定欧几里得算法之基础的一些思想，也可应用于求带有整系数的任意线性方 
程组的整数通解。例如，假设我们要求满足两个方程 


lOw + 3 x + 3^ + 82 ： = 1 
6 vj — 7 x — 5 2 ： = 2 


(17) 

(18) 
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的所有整数加，1，3；，2，我们可以引进一个新变量 

^10/3 J tv +L3/3 Jx + L3/3 + L8/3 J 2 ： = 


3tu + x + ^ + 2 z 

用它来消去: y; 则等式 （ 17) 变为 


h 


(10 mod 3) zv + (3 mod 3)x + 3ti + (8 mod 3) z = zv + 3t^ 
等式 （ 18) 保持不变，新的方程可以用来消去 w ，于是 （ 18) 变成 


即 


6(1 — L — 2z) — lx — 5z ~ 2 



lx + 18^ + 11 z — 4 
现在我们和前边一样引进一个新变量 


并从 (20) 消去: 



1 (19) 



It 



4t\ + 



2： 


4 


为了消去变量2：，可以用同样的方式引进另外一个新变量，它有最小的系数 


It 






Z 




从 (21) 消去 z 得到 



^2 + ’1 + 3^3 = 4 ( 22 ) 

最终这个方程可用来消去〖 2 。现在只剩下两个独立的变量 q 和〖 3 ;我们把它代回 
原来的变量就得到通解 

zv — 17 _ 5 / ^ _ 14^3 


x = 20 ~ 5ty — 17 ^3 
y = ~ 55 + 19^1 + 45^3 


(23) 


z = — + 7^3 

换言之，原来方程（17)、（18)的所有整数解均可从式 （23) 通过 q 和“ 

独立地取遍所有整数而得到。 


刚才说明的这个一般方法，是以下列过程为基础的 ：求出 方程组中绝对值最小 
的一个非零系数 c 。 假设这个系数出现于具有形式 


cx 0 + C\x x + + c k x k = d (24) 

的一个方 程中； 为简便计，假设 c >0 o 如果 c = l ， 则利用这个方程来从方程组的其 
它方程中消去变量 A ; 然后对剩下的方程重复此过程（如果再无剩下的方程，则计 

算就此停止，我们实际上已经得到了用未被消去的变量表示的一般解）。如果 c > 
1，则若 q mod c =…二 c k mod c =0,检查是否有 d mod c = 0,否则就没有整 数解; 

然后以 c 来除 (24) 的两边并像 c = l 的情况那样消去 ： c Q 。 最后，如果 r > l ， 而且 q 
mod c , c k mod c 不全为零，则引进一个新变量 

^clcjx 0 +LQ/C」jCi + … -\-lc k lcjx k = t (25) 

从其它方程消去变量 X Q ， 采用〖，并以 
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ct + ( c x mod c ) x { + ••• + ( c k mod c ) x k - d (26) 

代替原来的方程 (24)。 （参见上例中的 （19) 和（21)。） 

这个过程必然会终止，因为每一步骤或减少方程个数，或者减少方程组中最小 
非零系数的大小。对于确定的整数“和1；，当这个过程被应用于方程 iO ： + ^ = 1 
时，它实质上跑遍算法 X 的步骤。 

当只允许变量取整数值时，刚才说明的变量变换的方法是求解线性方程组的一 
个简单和直截了当方法，但它不是对于这个问题可利用的最好方法。有可能有实质 

性的改进，但它超出本书的范围[请见 Henri Cohen,A Course in Computational Alge ¬ 
braic Number Theory (New York : Springer ， 1993), 第 2 章]。 

对于高斯整数 + 和在某些其它二次数域中也可以使用欧几里得算法的变 

形。例如，请见 A . Hurwitz,Acfa Math . 11 ( 1987 ) ，187 〜 200; E . L‘Kaltofen 和 HL 
Rolletschek , Math . Comp . 53 (1989) ,697 —720; A . Knopfmacher 和 J ■ Knopfmacher , 

BIT 31(1991),286-292 0 


高精度计算 如果 w 和 I ； 是非常大的整数，并要求有高精度的表示，则二进制 
方法（算法 B ) 乃是计算它们的最大公因子的简单而又相当有效的方法，因为它仅含 
减法和移位。 

相比之下，欧几里得算法似乎就没有多少吸引力了，因为步骤 A 2 要求〃除以 r 
的多精度除法，但是这个困难实际上并不像它表面上看到的那么大，因为我们将在 
4.5.3 小节证明，商 LWw 」 几乎总是非常小的；例如，采取随机输入，商将在近 
乎99.856%的情况下小于1000。因此，利用单精度计算，连同比较简单的计算 
U - W 的操作，其中 <7 是单精度数，几乎总是有可能求出 L Ww 」 和 （ 〃 mod U) 。 而 
且，如果原来 u 比7；大得多（例如，初始数据可能有这种形式），我们对于有很大的商 
<7 并不介意，因为在这种情况下当以 w mod I ； 代替 w 时，欧几里得算法向前进/ 一 

大步。 

通过使用 D . H . Lehmer[AMM 45 (1938) ，227〜 233] 给出的一个方法，当涉及 
高精度的数时，可实现欧几里得算法在速度方面的一个重大改进。当仅处理很大数 
的前导数字时，有可能对大多数计算用单精度算术，从而大大减少了所涉及的多精 
度运算的个数。通过进行“虚拟的”计算代替真正的计算，我们能节省大量的时间。 

例如，假设我们正在使用仅有四位数字的字的一个机器，考虑一对八位数 
u = 27182818^ = 10000000。命/ = 2718， t /二 1001，= 2719，/ = 1000;则 


和 


U 


t // 都是 w / r 的近似，且 


u ' I V '〈 u I v 〈 u " I v " (27) 

比值确定欧几里得算法中所得到的商的序列。如果同时对单精度值 UW ) 和 


U V 


') 执行欧几里得算法，直到得到一个不同的商为止，则不难看岀，如果我们釆 
用的是多精度数 U ， D )， 到此为止的商序列应是相同的。于是考虑当应用欧几里得 
算法于 U ' t /) 和 U 〃， w 〃） 时会发生什么 情况： 
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f // // // 

q u v q 


2718 

1001 

2 

2719 

1000 

2 

1001 

716 

1 

1000 

719 

1 

716 

285 

2 

719 

281 

2 

285 

146 

1 

281 

157 

1 

146 

139 

1 

157 

124 

1 

139 

7 

19 

124 

33 

3 


在两种情况下头五个商相同，所以它们必定是真正的一些商。但在第六步以后，我 
们发现 〃，所 以停止单精度计算。我们已经获得了这样的知识，即如果我们使 
用的是原来的多精度数过程的话，则计算过程本应如下所列 

u v q 

以 0 ^0 2 

u q -2 v 0 1 

u 0 -2v 0 — wo 十 2 

U a Q 1 (28) 

— Wo 十 JUq — OVq 1 

3uq ~ Svq _ 4i/o 十 llt；o 1 

— 4 wq + 11 7 uq -19 vo ? 

(下个商位于 3 和 19 之间的某种。）不管在 w 和1；当中有多少位数字，只要 （27) 成 
立，则欧几里得算法的头五步总和 （28) 相同。因此我们可以避免头五步的多精度运 
算，而用 + 和 7 u 0 ~ 19 v 0 的一个多精度计算来代替它们。在这种情况 

下，我们将得到 a = 1268728， r = 279726 ; 这个计算现在将以类似的方式以 u , = 
1268 ， t /= 280,^ = 1269，丫 = 279,等等进行。如果有一个更大的累加器，则单精度 
计算还可以做更 多步； 我们的例子表明，一个复合步骤当中仅仅组合了欧几里得算 
法的5个循环，但对于（比如说 ）10 位数字的字长，我们一次大约能做12个循环。 
4-5.3 小节中证明的结果意味着，在每次迭代时可被代替的多精度循环的数目，实 
际上同在单精度计算中所用的数字个数成正比。 

Lehmer 的方法可系统阐述 如下： 

算法 L (对大数的欧几里得算法） 设是以多精度表示的非负整数，且 
V 。 本算法利用辅助的单精度位数字的变量 nA ， B ， C ， D ， T ， g 和辅助的多 
精度变量 r 和 w ， 计算 W 和^的最大公因子。 

L1 •[初始化]如果 w 小到足以表示成单精度的值，则通过算法 A 计算 
gcd ( m ) 并终止这个计算。否则，设&是^的 p 个前导数字并设6是 t ； 的 p 
个对应 数字； 换言之，如果采用6进制记法，则 u ^- Vulb k \ y v ^- lvjb k \^ 
中是在条件的前提下尽可能地小。 

置 A —1， B —0， C —0 ，D — 1。在算法 A 对多精度数的等价动作下，这些变 
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量表示 （28) 中的系数，其中 

U — Auq + Bvq , V = Cuq + Dvq (29) 

借助于上边例子中的记法，我们也有 

u ' = u B j v ' = tf + D ， u " 二 ☆ + A ， z / = ij + C (30) 

L 2. [测试商]置 g — LU + A )/ U + C )」。 如果 + B)/U + D )」， 则 

转到步骤 L 4。 （这一步骤测试在上述例子的记法下，是否 〆 当进行 
这一步计算时，在一些特殊情况下，可能出现单精度溢岀，但仅当 n = b p - 
1，且 A = 1 或当力= 6々-1和 D = 1时才会出现；由于（30)，条件 

0< a + A <^， 0 <：v + C < b p ⑶） 

O^ii + E < b \ + 

将总是成立。可能有 + C = 0 或 6 + 1) = 0, 但不能两者同时 成立； 因此， 
在这一步骤除以0就意味着“直接转到 L 4”。） 

L 3. [模拟欧几里得算法 ]置 T—A - qC ， A — C ， C — T ， T—B - qD ， B — D ， 

D — T，T — U — qD — v ， 6 — 了，并转回步骤 L 2 。（在 （29) 的约定下，这 

些单精度运算如同在 (28) 中那样都等价于多精度运算。） 

L 4. [多精度步骤]如果 B = 0，则利用多精度除法置 Z — w mod ^ p — 

to (这仅当单精度运算不能模拟任何多精度运算时才发生。它意味着欧 
几里得算法要求一个非常大的商，而这是极端稀少的情况。）否则，置 
Au ， t 一 t + Bv , Cu , uj ^~ zv + Dv , u — t ， r — w (直接利用多精度运 

算）。转回到步骤 L 1 d ■ 

由于（31)，贯穿于这个计算过程中 A ， B ， C ， D 的值始终是单精度的数。 

算法 L 要求比算法 B 有更复杂的程序，但对于很大的数，在许多计算机上它将 
是更快的。然而，算法 B 的二进技术可以类似的方式加快（见习题 38) 到它继续获 
胜的程度。算法 L 有这样一个优点，它确定在欧几里得算法中得到的商的序列，而 
这有许多应用（例如，请见 4.5.3 小节中的习题43,47,49和51)。也可参见习题 
4.5. 3 _ 46。 

* 对二进算法的分析 现在我们通过研究算法 B 的运算时间来结束这一节，以 
便论证早先指出的一些公式。 

算法 B 的特性的精确确定看起来极难推导，但我们可以借助它的特性的一个近 

似模拟来开始研究它。假设 w 和 I ；都是奇 数且〃 > r ，以及 

|_lg w 」 = ”2， l_lg u」 = n (32) 

(于是， u 是一个 （m + 1) 位二进位数，而 r 是 一个“ + 1) 位二进位位数。）考虑算法 
B 的一个减和移位循环，即在步骤 B 6 开始而后在步骤 B 5 结束之后停止的一个操 
作。对于 u > v 的每个减和移位循环，形成 u — v 并且向右移动这个数量直到得到 
代替〃的一个奇数为止。在随机条件下，我们将期望有大约一半的时间有/ = 
(u — t ;)/2, 有大约四分之 一 的时间有 i / = (w - t ；)/4, 有大约八分之 一 的时间 t / = 

( w _ ^)/8, 等等。我们有 
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\_^g u \ = m - k - r (33) 

其中々是 w - t ; 右移的位数， r 是 Llg u \~ l \ g(u - u )」， 即从 w 减期间左边失去的 
位数。注意，当 w >；2+2 时 r < l ， 而当 m - n 时 r > l 。 

焱和 r 之间的交互是十分混乱的（请见习题20 ) ，但 Richard Brent 通过假定 w 

和 r 都足够大以致一个连续的分布可描述比例 Wi 同时々离散地变化，发现了分 

析近似特性的一个很好的方法。[请见 J . F . Traub 所编 Ateont/ms and Complexity 
(New York ： Academic Press , 1976) ， 321 〜 355。 ] 我们假定 w 和 w 是实质上随机的很 

大整数，除非它们是奇数和它们的比有一个确定的概率分布。于是除非 r 将是偶 
数，否则在步骤 B 6 中的量〖二 w - i ; 的最低有效位实质上是随机的。因此 i 将以 
2〃的概 率是公 的奇数倍。这是在减和移位循环中需 要的々 个右移的近似概率。 
换言之，如果我们假定步骤 B 4 总是以1/2的概率转移到 B 3, 则我们得到算法 B 的特 
性的一个合理的近似。 

令 G „(: r ) 是在这个假定下在 n 个减法和移位循环被实施之后 mmU ，^)/ 

max ( w ， r )>: r 的概率。如果 u > v 而且如果恰好实施了 A 个右移，则比 X 二 vlu 被 
改变成 X ' = mm (2 k vKu _ v )，（ u - v ) l 2 k v ) 二 m \ n (2 k Xl(i - X ) ,(1 - X 、 l 2 k X )。 于 
是我们将有当且仅当 2 k X/(i - X )> x 和 （1 - 而这和 







是相同的。因此对于（: C ) 满足有趣的递推式 


(34) 


G 


U + 



X 


)= 22 


— k 


G 


n 


k>l 



2 k lxj 


G 


n 



2 


X 


(35) 


其中 G 0 (^) = l -^ o 计算的实验指出， G „ U ) 快速地收敛到一个极限分布 Goo 
G (: r )， 尽管收敛性的形式证明看来是困难的。我们将假定 GU ) 存在； 因此它满 

足，对于 0<： r < l ， 


GU) = |] 2 ""( G (rT^)- G (rr^)) (36) 

G (0) = 1； G ( l ) = 0 (37) 


S ( a :) 


2 


G 


1 


1 + 2 x 



l G ( 


4 





Ax j 



1 G / 



1 


1 



8 j ： 


+ 



于是我们有 
定义 



G ( x ) = S ( llx ) - S ( x ) 


(38) 

(39) 


G ( lix ) = - G ( x ) (40) 

使得对于所有： c >0,（39) 成立是方便的。当： r 从0跑到⑺时， S (： r ) 从0增到1，因 
此 G (: r ) 从+ 1减小成 -1。 当然当： r > l 时 G ( z ) 不再是一个 概率； 但尽管如此它 
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仍然是有意义的（请见习题23)。 

我们将假定有幂级数 

T m (:^ 和“:^使得 

CO 

G ( x ) = a ( x)\gx + ^( x ) + Xl ( y w ( x)cos 27 tm lg X + 8 m ( x ) s \ r \ 2 nm lg x ) 

m — 1 

(41) 

OQ 

S ( x ) = X ( x ) \g x + I ^( x ) ^ Yj (〜 (工 ) cos lizm lg 工 + r^dsin 2 v:m lg x ) 

m = 1 

(42) 

p { x ) = G (1 + x ) = p\x + | 0 2 x 2 + | 0 3 工 3 + + | 0 5 x 5 + ,06 x 6 + (43) 

因为可以证明 （35) 的解 GJjc ) 对于 n > l 有这个性质。（例如，见习题30。）对于 
UI <1 这个幂级数收敛。 

由等式 （36) 〜 （43)，关于 a ( x ), …， ^ U ) 我们可以推导出什么呢？首先从 
(38)，（40)和（43)，我们有 

2 S ( x ) = G (1/( 1 + 2 x )) + S (2 x ) = S {2 x ) - p (2 x ) (44) 

因此等式 （42) 成立当且仅当 

2 A ( j ： ) = X {2 x ) (45) 

2 /i ( j : ) = /u (2 x ) + A (2 x ) - p (2 x ) (46) 

2 cy m ( x ) = a m (2 x ) 2 r m ( x ) = r w (2: c )， 对于 m ^ \ (47) 

关系式 (45) 告诉我们 A (: r ) 只不过是 r 的一个常 数倍； 由于这个常数是负的，所以 
我们将写 

A ( x ) = - Xx (48) 

(相关的系数结果是 

A = 0.39792 26811 88316 64407 67071 61142 65498 23098 + (49) 

但尚不知计算它的容易的方法。）关系式 （46) 告诉我们当々>1时 p y = - A ， 而且 

2 m =2\ -2%;换言之，对于 k >2, 

u k = PkK ^ ~ 2 1 （50) 

从 (47) 我们还知道两个幂级数系 

= a m x , r m ( x ) = z m x (51) 

都不过是线性函数（对于 y w (： r ) 和 r ) 这不成立）。 

在 (44) 中以 l /(2: c ) 代替 x 得出 

2 S ( l /(2 x )) = S ( llx ) + G ( x /(1 + : c )) (52) 

而且当： r 接近于0时 （39) 把这个等式转换成 G 和 S 之间的一个关系 

2 G (2 x ) + 2 S (2 x ) - G ( x ) + S (： c ) + G ( x /(1 + x )) (53) 

当把这个等式两边展开成幂级数时 lgx 的系数必须一致，因此 

2 a (2 x ) - 4 Xx ~ a ( x ) - Xx + a { xj(l + : r ) ) (54) 
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G ⑴ 



图 10 在二进制 gcd 算法中的极限比分布 


除了常数义= - 以，我们现在知道 a U )， 而除了 系数仏 夕卜， （50) 把和 
〆 ：?：）关联起来。习题25的答案表明借助于，内，化，…可以表达 〆 JC ) 的所有系 
数； 而且，常数、 和、 可以通过用解习题29的方法来计算，而且在函数 yjx ) 和 
S w (： r ) 的系数之间的复杂关系也成立。然而，看起来没有办法来计算进入 G ( x ) 的 

各种函数的所有系数，除非通过精巧的数值方法来迭代递推式（36)。 

一旦我们已经计算了 G (: r ) 的好的近似，我们可以估计算法 B 的渐近平均运行 
时间如下 ：如果 u>v 且实施 A 个右移，则数量 Y = uv 被改变成 Y ， 二 （u - v ) v /2 k ; 
因此比例7/疒是2"(1-；0，其中 X=vlu 以 G (: r ) 的概率大于等于: r 。 因此平均 
说来中的二进位数以常数 

b = E lg( Y/Y” = S2'H/“0) + \ l G ( x ) f / k ( x ) dx ) 
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递减，其中 A (： c ) = lg (2 V ( l - x )) ; 我们有 


当最终 



S 2 -卞 

k>[ V 



G ( x )dx 、 

( 1 — j ：) In 2 y 



G(x )dx 

(1 — x ) In 2 


(59) 


u 二 v 时 ， lg 的预期值将近似于 0.9779( 请见习题 14); 因此算法 B 的减 


和移位循环的总数将近似于 1 M 乘以 lg 的初始值。由对称性，这大约是2/办乘 
于 lg W 的初始值。1997年由 Richard Breru 特所进行的数值计算给出对于这个基础 

常数的值 


2/6 - 0.70597 12461 01916 39152 93141 35852 88176 66677 + (60) 

Brigitte VaUSe 对这些函数的深入研究令她怀疑常数 A 和6可能通过值得注意 
的公式 


a = niii (6i) 

0 

来相关联。确实，由 Brent 所计算的值同这逗人的猜测完全 一 致 。V allee 已经使用 
非常重要的严格的“动态”方法成功地分析了算法 B [ A ] gorirhrm‘ca 22 (1998)，660〜 

685]。 

让我们回到我们在 （32) 中的假定，即《和是在 2 w < w <2 w + 1 和 2 乂 v < 
2” + 1 范围中的奇数。通过好几百万个随机输人和在 29< m ， n ( n 范围中的 m 和 
” 的各种值对于算法 B 的经验检验指出，这个算法实际的平均特性是由下列公式给 
出的 （m > : 


C ^ 



2 


m + 0.203 n + 1.9 - 0.4(0. 


6 ) 



D ^ ?n + 0.41 n - 0.5 - 0.7(0.6) m ~" 

而且这些观察到的平均值有一个相当小的标准差。 （62) 中 m 的系数1/2和1可以 
严格地加以验证（请见习题21)。 

如果我们转而假定 ^和 d 是在范围 

1 < “ < 2"， 1 < 1； < 2 n (63) 

的范围内独立和一致地分布 的任何 整数，则我们可以从已经给出的数据计算 C 和 D 
的平均值（请见习题 22): 

C ^ 0.70 N + 0(1), D ^ 1.41 N + 0(1) (64) 

这同对于 N ^30 对好几百万个随机输人所做的进 一 步的经验检验的结果完全 一 k 

致； 后者表明，给定输人〃和 p 的这个分布，我们可以取 

C = 0.70 N - 0.5, D = 1.41 N - 2.7 (65) 

作为这些值的适当估计。 

在 （63) 的假定之下，在 Brent 的算法 B 的连续模型中的理论分析预测 C 和 D 将 
渐近地等于 2/ V /6 和 4 N /6, 其中 2/^^0.70597 是 (60) 中的常数。同实验的一致性 
是如此之好，因此 Brent 常数2/6必定是 （65) 中的数“0 .70” 的值，因此我们应该以 
(62) 中的 0.206 代替0.203。 

这就完成了我们对于 C 和 D 的平均值的研究，出现在算法 B 的运行时间中的 
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其它三个量十分容易 分析; 请见习题6,7和8。 

既然我们知道平均说来算法 B 近似的特性如何，让我们来考虑一个“最坏情况” 
的场 景：在 某种意义下〃和 r 最难处理的值是什么？如果我们像在以前一样假定 

Llg w」 = m 和 Llg 。」 = n 

我们要来找出使算法最慢地运行的 w 和当考虑辅助的簿记时，减法比起移位稍 
微花更长些的时间。因此这个问题也可以通过求需要最多减法的输人 w 和^来重 
新表述。答案是令人惊 讶的； 尽管一个幼稚的分析将预测有可能有高得多的 C 值 

(请见习题35)，但 C 的极大值恰是 

max (m , ?2 ) + 1 (66) 

对于最坏情况 (66) 的推导是十分有趣的，因此把它留给读者们自己求解（请见习题 
36和 37) 0 


习题 

1 . [ M 21 ] 怎样从 (6) 和 （7) 容易地导出（8)，（9)，（10)， （11) 和 U 2)? 

2. [ M 22] 假定 w 整除巧巧…％,，证明 w 整除 

gcd ( w , Vi ) gcd ( u , v 2 )'" gcd { u , v n ) 

3. [ M 23] 证明使得 \ cm { u , v )= n 的有序正整数偶 U a ) 的个数是 ” 2 的因子个数。 

A .[ M 21] 假定 a 和 r 是正整数，证明存在 w 的因子，和 w 的因子/，使得 z / 丄 i / 和 〆 / = 

lcm ( u ， v ) 。 

► 5.[ A /26] 设计一个用于计算两个整数的最大公因子的算法（类似于算法 B )， 它以两数的平 
衡的三进制 表示为基础。把它应用于计算 gcd (40902,24140)。 

6. LM 22] 假定 w 和^是随机正整数，试求对程序 B 的计时起作用的量 A (它是在准备阶段 

对 w 和 r 两者的右移次数）的平均值和标准偏差。 

l .[ M 20] 分析对程序 B 的计时起作用的量 B 。 

► 8 .[/ V /25] 证明在程序 B 中，£的平均值近似地等于 + C ave ，其中 C a Ji C 的平均值。 

9.[18] 利用算法 B 和手算，求 gcd (31408, 2718 ) 0 利用算法 X ，也求整数 m 和《使得 
31408 m +2718/7 - gcd (31408,2718 ) o 

► 10.[// M 24] 设％ 是在的范围内使得 w 丄 z ; 的整数有序数偶“，的个数。本 
题的任务是证明 ： lim qjn 2 m 由 此建立定理 

oo 

a ) 使用容斥原理 （1.3. 3小节）证明 

q n = n 2 ~ p { } 2 + ^ L ”/〜々 2 」 2 _ … 

其中求和取遍所有素数 A 。' 

b ) 莫比乌斯 （ MGbius ) 函数 〆 ”）由下列规则定义 ：〆 1) 二 1， 如果 Pi ， P2 、 …， Pr 是不同素数， 
… A . 卜（-1)、而且如果”可由一个素数的平方整除， M ”） =0 。 证明 

L ”/々」2。 

c ) 作为 b ) 的一个推论，证明 

打一 、 CO 
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d ) 证明提示 ：当这 些级数绝对收敛时，我们有 

(2W) ( IX" 饥 = ) = 2 ( Yj a iP,id]l nZ 

V k^z / 、 //] 彡 1 / n ^'\ ^ d \ n " 

U .[ M 22 ] gcdU ， z ；)<3 的概率是多少？（见定理 DdgcdUw ) 的平均值是多少？ 

\ 2 .[ M 24 ] ( E . Cesoro ) 如果 u 和 u 是随机正整数，它们可能的公共（正）因子的平均个数是 
多少？（提示：见习题 10( d ) 中的等式，取七 = \ = 1 o ) 

13.[/ / M 23] 假定 w 和 r 都是随机的奇正整数，证明它们以 8/ tt 2 的概率互素。 

► 14 .[/ / M 25] 当 w 和 z ; 是 （ a ) 随机整数， （ b ) 随机正奇整数时 ， In gcd ( w , W 的期望值是多少？ 
\ 5 ,[ M 21 ] 当算法 X 终止时，…和％的值是多少？ 

► 16. [ A /22] 给定正整数《，1^和饥，且^与772互素，试设计一个算法做 w 除以 r 模 m 的除法。 
换言之，你的算法应该求在范围内的 w ， 使得 w = iw (modulo m ) Q 

> ll \ M 20 ] 给定两个整数 w 和 u 使得 _^ l ( modub 20, 说明如何来计算一个整数/，使得 
W 1 (modulo 2 2 0。[这导致计算一个奇数模2的幂的倒数的一个快速的算法，因为我们可以对 
于 e = 8 或 e = 16, 以所有这样的倒数的一个表开始。] 

► 18. [ M 24] 说明当 w 和^很大时，如何能推广算法 L (像把算法 A 推广成算法 X 那样）以得 
到 （15) 的解？ 

19. [ 21 ] 利用正文中的方法求下列方程组的整数 通解： 

( a ) 3 a : + 7^ + 112： — 1 ( b ) 3 x + 1 y + 11 2 ： — 1 

5 x + 1 y ~ 5 z = Z 5 x + 1 y - 5 z = - 3 

20 . [从 37] 设 u 和 i 是奇整数，独立和一致地分布于范围内。 
作为 m ， 72, m ' 和，的函数，算法 B 中的一个减和移位循 环把" 和 I ；减小到范围 2^< W <2 W ' + 1 ， 

+ 1 内的精确概率是多少？ 

21 . [ HM 26 ] 设，分别是在算法 B 中减和移位循环的平均次数，当〃和^是奇数时， 


Llgw 」=772 ，LlgtJ = «。 证明对于固定的7?，当 m — oo 时， C„,，, = + m + 0(1) 和 D wrJ 二？71 + 0(1) 0 

22 . 1 M 28 ] 继续上题，证明 ：如果 对于某些常数。，^和7，匕 ; ,,=讚+伽+ y , 则 


S ( N - m)(N - n )2 m ^~ 2 C rrtri 
1 ^ >/ < ；/] .\ ? 




(a + /?)N + 0(1) 




二 2 2N (^(a + _ + 0(1)) 


k 23.[ M 20] 当算法 B 以大的随机整数开始时，在算法的 n 次减法和移位循环之后， 

的概率是多少？（这里 1 是任何大于或等于0的 实数； 我们不假定 u > v 。) 

24 . [ M 20 ] 假定在步骤 B 6 中并假定比有 Brent 极限分布 G , 下次遇到步骤 B 6 B 寸 
u < v 的概率是多少？ 


25. [ M 21 ] 等式 （46) 意味着 -A ;证明& = A /2。 

26■[廳 ] 证明当 G (_ r ) 满足 （36) 〜 （40) 时，我们有 

2 G ( x ) - 5 G (2 x ) + 2 G (4 x ) = G (1 + 2 x ) - 2 G(L + Ax ) 


+ 2 G (1 + \ lx ) - G (1 + ll 2 x ) 
21 \ M 22 ] 证明 （58)， 它借助于伯努利数表达丸。 


28. [ HM 36 ] 研究也的渐近特性。提示：请见习题6.3-34。 

► 29 .[/ / M 26] ( R . P . Brent ) 求(: r ) ，即像在 （35) 中定义的那样，它是算法 B 头一个减和移 
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位循环之后 min ( u , v ) lmax ( w ， i ;) 的分布。提 7 K : 令 S }1 + Y ( x ) = 2 ^,(1/(1 + 2 k x )) } 并使 

K — I 

用调和数的 Mellin 转换方法[请见 P . Flajo 〖 et ， X . Gourdon 和 P. Dumas , Theor . Comp . Sci . 144 

(1995),3 - 58]。 

30.[// A /39] 继续上一题，确定 G 2 U )。 

2>\.[ HM 46] 证明或反驳 Vallee 的猜测（61)。 

32.[ M 47] 是否有满足 （36) 和 （37) 的惟一的连续函数 GU )? 

33.1 M 46] 试分析在程序 B 之后论述的 Hams 的“二进制欧几里得算法”。 

34 . [// A /49] 找出 Brent 的模型描述算法 B 的渐近特性的一个严格证明。 

35. [ M 23] 考虑对于所有非负整数 m ， n >0, 都有顶点 （ m ， w ) 的一个有向图，而且每当算法 
B 的一个减和移位循环有可能把满足 Llg «」= m 和 Llg 幻=«的整数 w 和 r 转换成满足 Llg u ]= 

和 ！ Jg /」 二 T ? / 的整数 t /和 t / 时，从 （wz ， 7?) 和 （〆， ^^有 一 条有向边；对于所有 n ^0也还有 一 
个特殊的“停止”顶点，以及从 U ，〃） 到“停止”的有向边。从 （ n ， n ) 到停止顶点最长的通路长度是 

多少？（这给出算法 B 的极长运行时间的上限。） 

► 36.[ M 28] 给定求使得 Llg w 」= w 和 Llg 幻二”的 w 和 r 的值，使算法 B 需要 m 

+ 1个减法步。 

37 . [ M 32] 试证明算法 B 的减法步骤 B 6 不会执行 1 + Llg max ( w ， i )」 次以上。 

► 38.[ A /32] ( R . W . Gosper ) 说明，使用类似于在算法 L 中的那些思想，如何修改对于大数的 

算法 B 。 

► 39.[ M 2 S ] ( V . R . Pratt ) 把算法 B 推广成为类似于算法 X 的一个算法 Y 。 

► 40.[ A /25] ( R . P . Brem 和孔祥重 （ H . T . Kimg )) 从硬件实现的观点看，下列二进制 gcd 算法 
的变形要比算法 B 更好些，因为它不要求对 r ; 符号的测试。假设 w 是奇数和^可以为正 
或为负。 

K 1 •[初始化]置 c — 0。（这个计数器估计 [ gU ! 和 Ighl 之间的差。） 

K 2 •[完成了吗？]如果 I ；二0,则以 M 作为答案结束。 

K 3 .[使 I ；为奇数]置 d — W 2 和 c — c + 1零次或多次，直到为奇数为止。 

K 4 .[使 c <0] 如果 c >0, 则交换 u ㈠ v 并且置 c —- c 。 

K 5• [减少]置 w ^~( u + v )/2 0 如果加为偶数，置 v^vu ;否则置 v — w _ v 。 返回到步骤 

K 2 0 I 

试证步骤 K 2 顶多执行2 + 2 lg max ( | u | ， I | ) 次。 

4\.[ M 22] 当 T / i 和 77 是非负整数时，使用欧几里得算法求 gcd(lCT - 1，10” - 1) 的一个简单 
公式。 

42. [ M 30 ] 计算行列式 

gcd (]， l ) gcd (1,2) … gcd ( l , n ) 

gcd (2 , 1) gcd (2,2) … gcd (2 ,n ) 

■ ■ ■ 

4 ■ • 

• • ■ 

gcd ( w ， l ) gcd ( n ,2) gcd ( n , n ) 

+ 4.5.3 欧几里得算法的分析 

欧几里得算法的执行时间依赖于 T ， 即实施除法步骤 A2 的次数（见算法 
4.5.2 A 和程序 4.5.2 A )。 量 T 在其它算法的运行时间中，例如，在满足互反公式的 
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函数求值算法（见 3.3.3 小节）的执行时间中，也是一个重要的因数。在这一节中， 
我们将看到对于这个量了的数学上的分析是有趣的和有教益的。 


与连分数的关系 


欧几里得算法同连分数有着密切的关系，连分数形如 




a 



bi 



I ( a \ + b 2 l ( + 



/(•••/(“ 


- 1 




”/^)…）））⑴ 


a 



b . 



a 


n —[ 



a 


连分数有一套美妙的理论，它是许多书的主题，例如， O . Perron,Die Lehre von den 
kettenbrUchen ，第 3 版 （ Stuttgart : Teubner ， 1954)，2 卷； A . Khinchin，ConDnued Frac ~ 
tions ，Peter Wynn 译 （ Groningen : P . Noordhoff , 1963 ) ; H . S . Wall ,Analytic Theory of 
Continued Fractions (New York : Van Nostrand ， 1948) 。关于这个课题的早期历史， 
也见 Claude Brezinski , History of Continued Fractions and Pade Approximants 

( Springer , 1991 ) 0 在这里有必要把我们自己限定在比较简略的对于这个理论的讨 
论，仅仅研究那些帮助我们对欧几里得算法的特性有更多了解的方面。 

我们主要感兴趣的连分数是 （1) 中所有6都等于1的情形。为了记法的方便， 


定义 


// 工1 ，工2，…， 


X 


J / 


l/(x 



1 /( 


^7 + 1/( … /(Ay + 1/ 


工” ）•■•))) 


⑵ 


于是，例如 


// 


X 


// 


工1 


// 工\、工1 I 卜 


^2 


JC 


+ 1 / 


XI 


X \ X2 



⑶ 


如果 n 


0,则符号// 


X 


，& //表示0。对于 n >0, 我们也定义 W 个变量的所谓 


连续多项式 (: r :，: r 2 ，… y x n ) ，其规则为 


K u ( x { i ^ n ) 


了 1 


如果 77 
如果 ： 



n 二 


⑷ 


X 1 X,^ J (x 2 r # * yOC n ) + K”— 2( 工 3, …， 工 


如果 n > l 


于是 ， K 2 ( 工 1 ，工2) =JT 丨： Z ：2 + 1 ，K 


Xy.X 2 .OC 2 ) = X!^2^：3 



^1 



^3 


，等等。 


般说来， 


如同欧拉在 18 世纪时所指出的， a ， x 2 ，…，:^ ) 是由 ： r 2 幵始，并删除 0 


个或多个非重叠的相继变量对 


x a 



而得到的所有项之和；共有 


个这样的 


项 


连续多项式的基本性质是显公式 


// ii ， x 2 , 


An II 


” 一 1 ( 2， 


攀#攀 


)1 K n ( x { , x 2 




n 


> 1 


(5) 


这可以由归纳法证明，因为它意味着 


x 0 



// 工 \ In II 


X , / + 1 ( x 0 ^i 




)1 K n (x 


1 • • - y ' 

，丄 >1 


因此 // 


^： o^i ，…， z 


// 是式右的倒数。 
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在 


K n ( xi ，工2,…，工„) 




( 6 ) 


的意义下， K 多项式是对称的。这由上面欧拉的发现推出，而且作为一个推论我们 


有，对 


71 


>1， 


K n ( x x , , x n ) 


X n^n- \ ( 工 1 ， 


yX n ^ 1 ) + 


•• A -2 


⑺ 


K 多项式也满足重要的恒等式（见习题 4) 



7Z (: r 】 ，…， jOK” （: r 2 , … ，工 n+i) - Ua ，…，: r 


7 ? + 1 


)U 工 2 ，".，：2^) 


( 8 ) 


后一等式同 （5) 在 




起意味着 


// 


X 


、…、工 yx II 


+ 



_ 1) 


n - 1 






Q2Q3 


Qn lQn 


(9) 


其中 


q k = K k (xi ，- •- y x k ) o 卞是 K 多项瓦 s 

在范围 0< X <1 中的每一实数 X 都有 


于是 K 多项式与连分数密切相关。 


个如下定义的正 则连分 数：设 X Q 


X 


而且对于所有使足 7 #0的 n >0, 设 


A ；J + 1 = Ll / X „ J , 


X 


刀+1 


1/ X , - A n + 1 


( 10 ) 


如果尤 


0,则量 Am 


和 尤 + 1 无定义，而且对于 X 的正则连分数是 // A , ，…， A 。 


// 


如果& #0,则这个定义保证了 0<尤 + 1 <1，所以每个 A 全都是正整数。 


(10) 的定义也意味着 


X 


X 0 


A ! + X , 


A 



1/( A 2 + X 2 ) 


因此，每当 X „ 有定义时，对所有72>1, 


X 


// A 1 ’ ... ， 1 ， A73 + // 


( 11 ) 


特别是，当& 




0时 ，X 




// A , 


參 

y 


»參 


， A „//。 如果则 X 总位于 // Ai ，…， 


//和 // A 〗 ，…， A „ + l // 之间，因为由（7)，量1 =心（八 1 ，一，„ + ；0随着丨从0 
增到 1 而单调地从 K „( Ai ，…， A ,,) 递增到 KjA . r -. A , + 1 ) ，而且，由 （ 9 ) ，当〜 
增加时，根据〃是偶数或奇数，连分数增加或减小。由（5)，（7)，（8)和（10)， 


X 


// A, 


// 


|// A 1 ,-, A , + X ,//-// A 1 ,-, A ；7 // 
I// A L ，…人 ，狀 //-// ，…人 // 


K A 2 ，…， ，1/ X „) 


, A n , l/Xj 

^ A n ) K n ^( A x 


UA! ， … ， A„ ， 1/XJ iUA! ，… 

,•••, A„)K„ + 1 (A 1 , A rj ,1/^ 

1 /( K „( Ai ，…， A „ ) K^ +1 ( A t ，…， A „ ， 


K n _ 1 ( A 2 ,***, AJ 


KAi, … ， A„) 
，…， A „，1/ XJ ) < 


+ 1 


)) 


( 12 ) 


因此，除非^很小，不然 // Ai ，…， A , 2 // 是 X 的极其接近的近似值。 如果& 对于所 


有的 n 都是非零的，在这种情况下我们得到一个 无穷的连分数 // A ^ A^A 


3,… 


//， 


这样的连分数的值定义为 


癱# 蠡 


，八^//;而且由不等式（12)，显然这个极 


71 


00 
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限等于 X 。 

实数的正则连分数展开有若干类似于十进数系中数的表示性质。如果用上述 
公式计算某些熟悉的实数的正则连分数展开，则我们发现，例如 

| =//3，1，1，1，2// 

」基 二// 1,1,9,2,2,3,2,2,9,1,2,1,9,2,2,3,2,2,9,1,2,1,9,2,2,3,2,2, 9,1,-* // 

H = 1 十//3，1，5，1，1，4，1，1，8，1，14，1，10,2，1，4，12,2,3,2，1，3，心1，1，2，14,3 〆 "// 

7 T - 3 +// 7,15,1,292,1,1,1,2,1,3,1,14,2,1,1,2,2,2, 2,1,84. 2,1,1,15,3,13,•■- // 
e = 2+// 1，2，1，1,4，1，1，6，1，1，8，1，1，10，1，1，12，1，1，14，1，1，16，1，1，18，1，〜// 

7 =// 1，1，2，1，2，1，4,3，13,5，1，1，8,1，2,4，1，1，40，1，11，3,7，1，7，1，1，5，1，49.“// 

命二 1 +// 1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1, 1,1,- // (13) 

数 Ai , A 2 ，…称做 X 的部分商。注意在★和 e 的部分商中出现的数的正则 

模式； 习题12和16中讨论了关于这一特性的原因，在方， 7 T 或 7 的部分商中没有明 
显的模式。 

说明这一点是有趣的，古希腊人在发现了无理数的存在性之后，对实数的头一 
个定义实质上是以无穷连分数叙述的（后来他们采取了 Eudoxus 的建议，即 x == ：y 

应定义为“对于所有有理数 r ，当且仅当： y < r 时 x < r )。 见 0. Becker , Queiien and 
Studien zur Geschichte Math . , Astron . , Physik B 2 (1933) ， 311 〜 333。 

当 X 是有理数时，正则连分数自然地对应于欧几里得算法。我们假定 X=vl 
W ，其中 w > v ^ Oo 正则连分数算法从 X 。= X 开始；我们定义 L/o = w ， Vq = I ；。假 

定尤 = K / 比乒0，（10)就变成 

A ,, + 1 = LUJVJ , U 二 Ujv n - A n+1 = ( U n mod VjlV n (14) 
因此，如果我们定义 

u n + l = v ny V v + [ = V n mod V w (15) 

则在算法执行全过程中，条件 X ;; = VJU „ 都成立。而且， （15) 恰巧是在欧几里得 

算法中对变量所做的变换（见算法 4.5.2 A ， 步骤 A 2) 0 例如，由于_ = //3，1， 

1，1，2//，我们知道应用于 W =29 ，p = 8 的欧几里得算法恰好要求5个除法步骤，而 
且在步骤 A 2 中的商 LWu 」 将逐次为3，1，1，1和2。当 X n = O y n > l 时，最后的部分 

商 A „ 必然总是2或更大，因为小于1。 

从同欧几里得算法的这个对应关系，我们可以看出，当且仅当 X 是有理数时， 
对于 X 的正则连分数展开以^=0终止在某 一步； 因为很显然，如果 X 是无理数， 

则 X ,,就不能为0,反过来我们知道，欧几里得算法总是有穷的。如果在实施欧几里 

得算法期间得到的部分商是 A 2 ，…， A „， 则由（5)，有 

X ,_ 1 ( A 2 ,-- ,AJ 
K „( A " A 2 ，…， ) 


u 


(16) 
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当 A 1 = 0 时，如果对 u < v 应用欧几里得算法，这个公式也成立。而且，由于关系 
(8)，连分数…， AJ 和 KJA ;， A 2 ，…， AJ 互素，而 （16) 右边的分数是在 
最低项中，因此 

U = K ”（ A 1 ， A 2 ，…， V ， V = K „_ 1 ( A 2 ,**- , A n )d (17) 

其中 3 = gcd ( u , v ) 0 

最坏情况 我们现在可应用这些观察来确定在最坏情况下欧几里得算法的特 
性，或者换言之，来给出除法步数的上界。当输入是连续的斐波那契数时出现最坏 
的 情况： 

定理 F 对于 n > l , 设 u 和 v 是满足 u > v>G 的整数，并且使得应用于 u 和 v 
的欧几里得算法恰好需要71个除法步骤，而且使得 u 是满足这些条件的尽可能小 

的数。贝 1 j U = h F ^ + yo 

证明由 （17)， 我们必然有"二 KAhAs ，…，其中 A M A 2 ，…， 

是正整数，而且 A ;? >2 0 由于是具有非负系数的一个多项式，包含着所有的变 
量，故仅当 Ai = 1，…，_ 1 = 1，= 2 ， d = 1时才达到极小值。在 （17) 中置这些 
值，就得到所求的结果。 ■ 

这一定理在历史上被说成是斐波那契序列的头一个实际 应用； 此后就逐步发现 
了斐波那契数在算法和算法研究中的许多其它应用。这个结果实质上是由 T _ F.de 
Lagny 给出的 [ M ^ m . Acad . Sci . 11 ( Paris ，1733) ，363〜364]，他把好多个连分数造 

了表并且发现对于一个给定的长度的连分数来说，斐波那契数给出最小的分子和分 
母。然而，他没有明确提到 gcd 计算； 斐波那契数和欧几里得算法之间的联系是由 
LSger 首先指出的 [Correspondence Maf / i . ef Physique 9 (1837)，483 〜 485] 。 

不久之后， P . J . E . Finck [ TVa;re Elementaire d f Arithmetique ( Strasbourg •• 1841) ， 

44] 通过其它方法证明，当 u > v >0 时， gcdUa ) 至多花费2 lg w + l 步； 而且 G . 
Lame[Comptes Rendus Acad . Sci . 19 ( Paris , 1844 )，867 〜 870 ] 把这改进成 5 [ logjo 

(^ + 1)1。关于算法分析先驱研究的完整细节出现在夂0.81^114的一篇有趣评论中 
[His tori a Mathematica 21 (1994)，401 〜 419 ] 。然而，对于最坏情况的一个更精确的 

估计，是定理 F 的一个直接 推论： 

推论 L 如果则当算法 4.5.2 A 应用于 u ， v 时，所需要的除法步骤 
数至多是 Llog /3-« N 」。 

证明在步骤 A1 之后我们有 v > u mod w 。 因此由定理 F ， 当 I ； = F , ; + 1 和 
u mod 1 ； = ^时出现极大步骤数心由于 F ，, + 1 < N , 我们有 f 7 + l / W < N (见等式 
1.2.8-( 15))，所以 今 }, 〈(秘 ) N =(3 -今) N 。 ■ 

log ^(3 -«N 近似于 2.078 In N + .6723^4.785 + log| 0 N 十.6723。关于定理 
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F 的推广见习题 31，36 和38。 
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一 个近似的模型 既然已经知道了可能出现的极大除法步骤数，我们即可求出 
平均数。设： T ( m ，；0 是当欧几里得算法的输入为 w = 时所进行的除法步 

骤数。于是 

T ( 7?2 ,0 ) = 0; T(m f n) = 1 + T ( n , ?n mod n ), 如果 (18) 

设 7； 是当 r = n 和当 w 随机选择时的平均除法步 骤数； 由于在第一次除法步骤之 
后，只有 w mod I ；的值影响这一算法，故我们有 

T n = - 2 T{k,n) (19) 

71 0^k< n 

例如，: T (0,5) = 1， T (1，5)=2,7 X 2,5) = 3， T (3,5) =4， T (4,5) = 3, 所以 

T 5 = y(l + 2 + 3+ 4 +3) = 

我们的目的是估计当 72 很大时的 T „。 一个想法是试验由 R . W . Floyd 提出的 

一 个近似 方法： 我们可以假定，对于 Q < k < n ， n 的值模6实质上是“随机”的，于是 
我们置 

T , ^ 1 + 士 ( T 。 + + …+ 

因此，其中序列 〈 S 7 ,〉 是递推关系 

S 0 = 0 ， S„ = 1 + 去 (S 。 + S! + …+ S„ — 1 )， n ^ 1 (20) 

的解。注意到 

^n + l =1 + n \ i(S。 + + *•* + S n -1 + S n )= 


1 + 7TT (n(s ” ~ 1} + = s ， VTi 

这个递推式容易 求解； 因此\是 i + + + …+丄=^^，即是一个调和数。现在近似 

Z n 

T n ^ S n 提示，我们可以有 T^lnn + 0(1) 0 

然而，把这个近似值同了„的真值表作比较表明 In n 太 大了； T ” 并不这样快地 
增长。我们关于 n 模々是随机的尝试性假定因此太悲观了。确实，更仔细的观察表 


明在的范围内 ， mod k 的平均值小 于各々 的平均值: 



n 


S ( 

1 ^ ^ ^ n 


n mod k ) 


= ^S<^"^ )CLn/(g + 1)J< " <LWd] = 



• 327 • 


第 4 章算术 


(参考习题 4.5.2-10( c ))。 这大约只是 .1775/ z ， 而不是 .25 n ; 所以 n mod k 的值势 
必小于 Floyd 模型的预测，因此欧几里得算法比起我们预期的更快。 


一 个连续的模型 当 v 二 N 时，欧几里得算法的特性实质上决定于当 X 二 01 
N ， l / iV ，*"，（ iV - l )/ iV 时，正则连分数过程的特性。因此我们要研究当 ] V 很大和 
当 X 是在[0，1)中均勻分布的随机实数时正则连分数的特性。给定 X = X 0 的一个 

均匀分布，考虑分布函数 

F n ( x ) = Pr ( X ;J < x ) ,对于 0<： r<l (22) 

由正则连分数的定义，我们有 F Q ( x ) = : r ， 而且 

F n + [ ( x ) = J ^ Pr(k < HX n < 々十 x ) = 

k >\ 

+ 工 ） < 又 ^llk) = 

k^l 

S ( F „(1/^) - F n ( ll(k + ^))) (23) 

k>l 

如果由这些公式定义的分布…趋向于一个极限分布 F ^ ix ) = 
F ( x )， 则我们将有 

F ( x ) - X ( F ( llk ) - F ( ll(k + 1))) (24) 

走>1 

(一个类似的关系式4.5.2-(36)在我们关于二进制 gcd 算法的研究中出现过。）对任 
何底6>1，满足 (24) 的一个函数是 F (: r ) = [ og 6 (l + ： r ) ; 见习题19。进一步的条件 

F ( l ) = 1意味着我们应取 b =2 0 因此，有理由猜测 F ( x ) ■- = lg(l +工），并且 F n ( x ) 

趋于这一特性。 


例如，我们可以猜测 ， F 


2 


lg 


/ 3 


2 




0.58496; 让我们看看对于小的 n ， 


F 


>1 



如何接近于这个值。我们有 F 


0 


2 


0.50000,而且 


FA 


x 



1 


k >\ 


k 


k 



H 


x 


X 




2 


H 


1/2 


2 - 2 In 2 ^ 0.61371 


F 


2 



H 


2/2 


H 


2/3 



H 


2/4 


H 


2/5 



H 2 / 6 - H 


2/7 



(参见附录 A 的表 3。） 幂级数展开 


H x 


^(2)x - f(3) 工 2 + f(4)jc 3 - ^(5)x 



使得计算下列数值成为 可能: 


(25) 


F 2 




2 




0.57655 93276 99914 08418 82618 72122 27055 92452 - (26) 


我们更接近于 0.58496; 但是并非立即就清楚，对于 


^ =3如何得到 F n 
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好的估计，而对真正大的 n 值则更不清楚。 

C . F . Gauss (高斯）最先研究了分布 F „ U )。 1799年2月5日，他第一次考虑了 

这个问题。他于1800年在笔记本上列出了各种递推关系并且给出了一份简单的值 

表，包括(不精确的）近似〜0.5748。在进行了这些计算之后，高斯写到 ：“它 

们变得如此复杂，以致看来没有什么希望了。”12年后，高斯写了一封信给拉普拉 
斯，信中把这作为他不能满意地解决的问题提出来。他 写到： “通过非常简单的推 
理，我发现，对于无穷的 72, F n ( x ) = log(l + ^：)/log 2 0 但是自那以后，我对于很大 

的，但不是无穷的72值，为确定 F „ U ) - bg(l + x ) l\og 2 所做的努力，都毫无结 

果，他根本没有发表他的“非常简单的推理”，而且也不完全清楚他是否果真找到了 
一 个严格的证明[见其 Werke , 〜556]。自那以后过了一百多年，才由 R . 

CKKuz，min 发表了—^个证明 [Atti del Congresso Internazionale dei Matematici 6 
( Bologna , 1928)，83 〜 89] ，他证明，对于某个正常数 A ， 

(: r ) = lg (1 + 工）十 0 ( e ~ A ^) 

不久 ， Paul L 纟 vy 把误差项改进成 O (e A ”） [ Bu //. Soc. Math , de France 57 (1929)， 

178 〜 194]> ;但 是高斯的问题，即求 F „( x ) - lg(l + x ) 的渐近特性问题，一直到 

1974年当 Eduard Wirsing 发表了关于这一情况的漂亮的分析时，才真正地解决了 
[Acta Anthmetica 24 (1974) ，507 〜 528] 。这里我们将研究 Wirsing 方法的最简单方 

面，因为他的方法是线性算子的一个有教益的用法。 

如果 G 是对于 0<： r < l 定义的工的任何函数，命 SG 是由 

SG ( x ) = 2 (G 

k ^\ \ 

定义的函数。于是， S 是把一个函数改变成另一个函数的算子。特别是，由 （23) 我 
们有仄 + 1 “） 二 SF 〃 U )， 因此 

= S n F 0 (28) 

(在这个讨论中，代表一个分布函数，而不是一个斐波那契数。）注意， S 是一个 
“线性算 子”； 即对于所有常数 c ， S ( cG ) = c ( SG)，S S ( Gi + G 2 ) = SGi + SG 2 。 

现在如果 G 有一个有界的一阶导数，我们可以逐项地求 (27) 的微分以证明 

( SGV “） = 2 (29) 

^ (k -V x ) 1 \k + X j 

因此 SG 也有一个有界的一阶导数（当导数的级数一致收敛时，一个收敛级数的逐 

项微分是正当的；参考 K . Knopp , Theory and Application of Infinite Series (Glasgow : 
Blackie ,1951), §47)。 

命 H = SG ， 并设 g ( jc ) = (1 + x ) G ' { x ) y h ( x ) = (1 + x ) H ' ( x ) o 由此得出 

^ 关于 Lhy 的有趣证明的说明见本书第 l 版。——原注 
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h ( jo ) 


= 2 
k^i 




换句话说， 



巧，其中 T 是由 



定义的。 



(30) 


继续下去我们看到，如果 g 有一个有界的一阶导数，我们可以逐项微分以证明 
Tg 也有： 



I k ^ ~ 1 \ 1 J 1 \\ 

\k + I + X k + x ) (k + x) lg \k + x )) 



k 


k ^\ 


、（是 + 1 + : r ) 


g 




x 


g 




1 + 


+ 


X 



X 


/ 


(^ + x ) 3 (^ + 1 + j : 


g 



k 



X 


结果就有第三个线性算子 U ， 使得 （ Tg )，= - U ( g ) y u\l 


Ucp ( x ) 



k 


k^l 


(k 



1 + X ) 


2 


l/U + _ r ) 


llik + i + x 


( p ( t)dt 



1 

1 + ^ 」： 

L \ 

(k + x )' 

3 U + J 

L + VUh 

卜 z / 


所有这一切同我们的问题有什么关系？好，如果我们置 

F ^ ix ) = lg(l + ^:) + R n ig(l + x )) 


(31) 

(32) 


/ w ( jc ) = (1 + x ) F / n ( x ) = j^(l + R^ilgd + x ))) (33) 

我们有 

f n { x ) = . R ^( lg(l + x))/((ln 2) 2 (1 + x )) (34) 

在这些变换之后， lg(l + i ) 项的作用就消失了。而且因为 圮 = S ” F Q ，我们有/„ = 

T % 且= 对于 n 用归纳法，可证与/，，都有有界导数。于是 

(34) 变成 

(- l )^ R :( lg(l + ： c )) = (1 + ^： )(In 2) 2 U n fQ ( x ) (35) 

现在 + 且 A ( x ) 是常数函数1。下面我们来证明算子 LT 


使常数函数成为一个具有非常小的值的函数，因此对于 0<: r < l ， | i ^(： r ) | 必定非 
常小。最后，我们可以证明本身很小以使这个论证确定无疑 ：由于 我们有 
(0)=尺〃（1) = 1，由熟知的内插公式（以： r 0 = 0 ，：Ti = x ，: c 2 = l 参考习题 4.6.4-15) 
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得出，对于某个函数 IU )， 
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义（工）=~ ^ (1 2 ~ 尺: ：( 匕(: 0) (36) 

其中，当 0< x < l 时，0<氕 （工) <1。 

现在一切取决于我们是否有能力证明 [^产 生小的函数值，其中 U 是 （31) 中 
定义的线性算子。注意到对所有： c ， 若 p (： r )>0, 则对所有 X ， L ^ U )>0。 在这个 
意义下，[/是一个正算子。由此得出，[/是保序的 ：如果 对所有 jc J ( p l ( x )^( p 2 ( j ：) y 
则对所有： f 我们有 UcpiUXl ^ U )。 

剖析这一性质的一个办法是求一个这样的函数卜使得我们能精确地计算[/… 

并且使用这一函数的常数倍来界囿我们真正感兴趣的那些函数。首先，我们找这样 

的函数 g ■，使得 Tg 是容易计算的。如果我们考虑对于所有 x >0, 而不是仅仅对[0, 
1] 定义的函数，注意到当 G 连续时， 


SG ( x + 1) - SG ( x ) 


= G 



- lim G 


□o 



G(o) (37) 

\ 丄 + X / \ ’ 

因此容易从 （27) 去掉求和。由于 了 （（1 +1)0 = (I + jcKSGV ， 由此得出（见习题 
20 ) 


iKi^l _ 7g(l + x) = / 1_1_\ / 1 \ …、 

1 + x 2 + x (1 + x 2 + x) g \l + x ) ( 38 ) 

如果置 Tg ( x ) = l /(1 + x )， 我们会发现 g ■(: c ) 对应的值是1 + :r - 1/(1 + ： c )。 设 

p ( x ) = /( x ) = l + l/(l 十工） 2 ,则 U ? U ) 二 — (7>) / (幻=1/(1 + ：0 2 ; 这就是我们 

寻找的函数 

对于 P 的这个选择，对于0<工<1，我们有 2<^( x )/^( x ) = (1 + x ) 2 + 1< 
5,因此 


U<p ^ 



9 


由 N 和炉的正定性，我们可以再次把 U 应用于这个不等式，得到土 

在应用 n ~ l 次后，我们对于这个具体的 p 有 

5->< (39) 

命%(^) =/ o (^) = 1是常数函数，则对我们有寻，因此 

" g "^ n X ^ 士 L 7 ”x < 音 < 音 2 -Y < 香2 -”％ 

由 （35) 得出，对 0<x<l， 

f On 2) 2 5-" < (― l) n R ： {x) < y(ln2) 2 2- JJ 
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因此由 （32) 和（36)，我们证明出下列 结果： 

定理 W 当”一 oo 时，分布]^(工）等于 ig ( 1 + :c ) + 0(2 -〃）。 事实上，对于0< 

: c < l ， F „( x ) - lg ( l + 1) 位于盖（_ lr + WnCl + : r ))( l n 2/(1 十 1)) 和 | ■( — 

l )^ 2 2^( ln(l + x))(ln 2/( 1 + x ) )^/0 /o I 

通过选择一个稍微不同的心我们可以得到更严密的界（见习题21)。事实上， 
Wirsing 在他的论文中走得更远，他证明 

F „( jc ) = lg(l 十 x ) 十（- A ) n ^( x ) + 0(^(1 - x)(X - 0.031 广） (40) 

其中 

A =0.30366 30028 98732 65859 74481 21901 55623 31109 -二 

// 3,3,2,2,3,13,1,174,1,1,1,2,2,2,1,1,1,2,2,1, •■• // (41) 

是一个基本常数（显然同更熟知的常数无关），而且其中少是一个有趣的函数，除由 
-1 到- 00 的负实轴外，它在整个复平面上是解析的。 Wirsing 的函数满足平(0)= 
^(1)=0, ^(0)<0以及 S ^= - A 氺； 因此由（37)，它满足恒等式 

^(z) - 氺 U + 1) 二 j (42) 

而且 Wirsing 演不了，当 JV — 00 时 

少 (- f + ☆卜 log N + 0(1) (43) 

其中 e 是一个常数，而且当把欧几里得算法应用于整数 W > t ;>0 时 ， n = 

是迭代的次数。 

过了 一 些年后，才由 K . I . Babenko [ DoWac/y Akad . Nauk SSSR 238 (1978),1021 
〜 1024] 找到了高斯问题的完全的解。他使用强有力的泛函分析技术证明对所有 

, n ^1, 


F n (^) = lg(l + ： r ) + X / ^ j (^) (44) 

j>2 

这里 U 2 | > | a 3 |>| a 4 |>. •，而且 每个％ (幻是除了割线[-⑴， -1] 之外的复平 

面上的解析函数。函数少 2 是 Wirsing 的氺， A 2 = - A ，而 A 3 〜 0. 10088, A 4 ^ 

-0. 03550, A 5 ^0. 01284, A 6 ^0. 00472, A 7 ^0.00175 o Babenko 也求岀了特征值 A ; 

的进一步性质，特别是证明当 j — 〜时，它们按指数速度变小，而且在 （44) 中对于 

的和以 U 2 /6) | _ x ) 为界。[关于进一步的介绍见 Babenko 

和 Yuriev,DoWady Akad . Nauk SSSR 240 (1978), 1273 〜 1276; Mayer 和 Roepstorff ， 
J . Statistical Physics 47( 1987) ， 149 〜 171; 50 (1988) ， 331 〜 344; D . Hensley J . Num - 

ber Theory 49( 1994) , 142 〜 182 ; Daude , Flajolet 和 Vallee , Combinatorics ， Probability 
and Computing 6 (1997) ， 397 〜 433; Flajolet 和 Vallee , Theoretical Comp . Sci . 194 
(1998) ， 1 〜34。 ] (41) 中 A 的 40 位值是由 John Hershberger 计算的。 

由连续到离散 我们现在已经推导出了当 x 是在区间[0，1)上均匀分布的一个 
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实数时，关于连分数的概率分布的一些结果。但是一个实数是有理的概率为0—— 
几乎所有数都是无理的——所以这些结果不能直接应用于欧几里得算法。在我们 
可以把定理 W 应用于我们的问题之前，必须克服某些技术性的困难。考虑以初等 
测度论为基础的下列 观察： 


引理 M 设，…， J 2 J 2 ，…是包含在区/司[0，1)中的互不相交的区何，弁设 

J = U 4 ， S = II J k 又 = [o,i] \ (/ U J) 

炎>1 石>1 

假设又的测度为 0, 又设 P„ 是集合 \Qln ， lln ，…， （n - l、!n \ ，则 

o n p \ 

lim—^ - "⑷ (45) 

oo 72 

这里 "㈤ 是 J 的勒贝格测度，即 S^lengthU) ， 而且 I 表示在集合 

中的元素个数。 

证明设 〜 = U ^ 及久 v = U 。给定 f 〉 0 , 找 一 个足够大的 N 使 

得 "( 〜）+ - (，并设 

= ^ u U ^ u U ^ 

k>N k>N 

如果 J 是具有 U ， 6) 或 k ， 6) 或 U ， 6] 或 [a j] 中任何一个形式的区间，显然 

nju( I) - 1 ^ |J p| -P„ I ^ njLt(I) + 1 

现在设 ％= I o N n p T1 1 丨 =I n p n \,t n = I ^< N r\p n i ; 我们有 


因此， 


nju ( 0 N ) 
nju (^ N ) 



N < r n 
N< l 


^ rtfjL ( ) + TV 

^ nju (^ N ) + N 



N 


n 


- ( ( o N ) 




N 

n 


< 


r 


n 


n 




r 


n 




n 


n 


n n n 

这对所有的 n 和所有的 f 成立；因此 lim rj n = 。 | 

习题 25 表明，为证明 （45) 需要 i 些稍加限制的假设。在这个意义下，引理 M 
是不平凡的。 


部分商的分布 现在我们可以把定理 W 和引理 M 合在一起来推导关于欧几 
里得算法某些实实在在的事实。 


定理 E 设 n 和 k 是正整数，并设 p k ( a ， n ) 是当 v = n 和 u 随机选择时，欧几里 
得算法 中第 U + 1 ) 个商 A k + : 等于 a 的概率，则 



• 333 • 



4 章算术 

其中， F k ( x ) 是分布函数（22)。 

证明[0，1)中使得 A , + 1 = a 的所有 X 的集合"是一些不相交区间的并，因此 
使得 A , + 1 ^ a 的所有 X 的集合5也是这样。因此，对于使得 A , + r 没有定义的所有 
X 的集合又可应用引理 M 。 而且， h ( l / a ) - P \( l/U + 1)) 是 1 /U + 1)<&<1/ 
a 的概率 〆 Z 7)， 即 A ^ +1 = a 的概率。 ■ 

作为定理 E 和 W 的一个推论，我们可以说 ，一 个等于 a 的商出现的近似概率为 

ig(l + lla ) - lg(l + l/(a + 1)) = lg((a + l) 2 /((a + I ) 2 - 1)) 

于是 

商1出现的概率是 lg (音 )=41. 504 %; 

商2出现的概率是 lg(-|J = 16.993%； 

商3出现的概率是-9.311% ; 

商4出现的概率是 

实际上，如果欧几里得算法产生商 Ai ， A 2 ，…， A ,， 则仅当々相对于〖来说相当小时， 
上边一些证明才能保证 A , 的这一特性；值…不为这个证明所包括。但 
是事实上我们可以证明最后的商 A ,-,， A Z _ 2 ，…的分布实质上和最初的是一样的。 

例如，考虑其分母为29的所有真分数集合的正则连分数 展开： 

^ =//29// ^ =//3, L , UL 2// || =//1,1,14// g =//1,3,7// 

^ = // 14,2 Z 7 ^ = // 3,4,2 // 尝=夕 1，1，4,3 # || 二//1，3，1，5// 

— =// 9,ly2 // ■— = // 2,\y9 // 呈 =# 1 ， 1 ， 2,2,2// l, 4,1,4 // 

^ 二 111 A II ^ -//2,1,1,1,3, // ^| -// M , M ,1,3// § -// 1,6,4// 

~ = // 5,1,4 // || = // 2,2.2,2 // || = // 1,1,1,9 // || = /^ 1,8,1,2 // 

^ -^ // 4,1,5// H = // 2,4,3 // ^ = ^ ^2,4,2 // % ~ ^ 1»13,2 // 

丟=/"，7// 芸=//2，14// 豈二 //1,2,1，1，1，2// || =// 1,28// 

通过这个表可以得到以下 事实： 

a ) 如同早先提出过的，最后的商总是2或更多。而且，我们有明显的恒等式 

// X !，…， — 1 ,: r „ + 1 // = // : rj [，… ，工”，1 // (46) 

而这表明其最后一个商为1的部分分式是怎样同正则连分数相关的。 

b ) 右边一列的值和左边那些列的值有一个简单的 关系； 在往下读之前读者能发 
现这个对应关系吗？有关的恒等 式是： 
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1 —II x x ,x 1 . 






// 1，工 i 一 1，:…， 




(47) 


见习题9。 


) 在头两列中，左边和右边之间有对称性：如果 // A ^ Az ， …， A z //出现，则 


//她,，一，^ 2 ，焱 1 //也出现。情况将总是这样（见习题 26) 


o 


39 


d ) 如果我们考虑表中所有的商，我们发现总共有％个商，其中 g = 40. 6%等于 
I 2 - = 219%等于2，-:8.3%等于3;这同上边列出的概率相当吻合。 


除法步骤数 现在回到我们原来的问题并观察7；，即当 r 
平均数（见等式（19))。下面是 T „ 的某些值的抽样。 



时除法步骤的 


n — 

95 

96 

97 

98 

99 

T 二 

- 1 n 

5.0 

4.4 

5.3 

4.8 

4.7 

n ~ 

996 

997 

998 

999 

1000 

T = 

± n 

6.5 

7.3 

7.0 

6.8 

6.4 

n — 

49998 

49999 

50000 

T = 

丄 n 

9. 

8 

10.6 

9.7 



100 101 102 103 104 105 


4.6 

1001 

6.7 


5.3 


4.6 


5.3 


4 % W 


9999 


8 ‘ 



4.7 

10000 

8.3 


4. 



10001 


9.1 


50001 

10.0 


修》 ■ 


99999 100000 100001 




10 . 



10.3 


11 . 



请注意一个奇特的特 性：当 ^为素数时7；趋向于比它的邻值更高，而当 n 有 
许多因子时，则比邻值为低（在此表中，97,101，103,997和49999是 素数； 10001 = 


73 


49998 = 2-3- 13 -641:50001 


7 • 2381； 99999二3 • 3 • 41 • 271，100001 


11.9091)。不难理解这为什么出现 ：如果 gcd ( w ， t ;) = 1则应用于 W 和的欧几里 
得算法的特性实质上就好像它应用于和那样。因此，当 V = n 有若干个因 
子时，有好几种 w 的选择，使得 n 的行为好像是它是较小的那样 


O 


由 此我们考虑另 


个量7^，它是当 



和当 



与 77 互素时的平均除法次数。 


于是 



n 





T ( m ， 


n 


(48) 


0 ^ m < 



由此得出 


T 


n 


n 


2]cp(d) 



d 


( 49 ) 


下面是对于和上边所考虑的相同的 〃 值的 q 的一张表。 


n 





n 


95 

5-4 


96 

5.3 


97 

5.3 


98 

5.6 


99 

5.2 


100 101 102 103 104 105 


5.2 


5.4 


5.3 


n 




996 997 998 999 1000 1001 


« * * 



n 


7.2 


7. 



7. 




■ 3 


7.3 


7.4 


■ ■秦 


9999 

9.21 


5.4 

10000 

9.21 


5. 



5.6 


10001 

9.22 
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n 




49998 49999 50000 50001 


» 鬌 ■ 


r 


n 


10.59 


10.58 


10.57 


10.59 


99999 100000 100001 

11.170 11.172 11.172 


显然，的特性比 I 好得多，因此它应当更易于分析。观察对于小的”的 


r 


n 


表揭不了某些奇怪的异常性，例如『50 = r ■及 r 6 G = r 12 Q 。 但 





T 


n 


的特性 


确实如上表所表示的那样十分规则，而且它们没有显出同”的因子分解特性有任何 
重要的关系。如果对于上边给出的^值，在图纸上画作 In 72的函数，则将发现这 

些值非常靠近以下的直线 


r n 〜0 • 843 inn 



1.47 


(50) 


如果我们再进一步研究连分数过程，就可以解释这一特性。如同在 （15) 中所表 


述的那样，在欧几里得算法中我们有 

V 0 V 


U 0 U 


] 


U t - { 


V 


一 1 


U 0 


因为 a 
有 


因此如果 L 7= Uo 和 v 0 互素 ，而且 如果有 z 个除法步骤，我们 


X 0 Xr •足— 


1 


Hu 


置 L / 


TV 和 V = m < 7 V ， 我们求得 

lnX 0 + lnXi + 


mm% 


+ lnX^i = - InN 


(51) 


我们知道 ， X 2 , …的近似分布，所以可以利用这个等式来估计 




丁 ( N，m 


T ( 


m 


， N) - 1 


回到定理 W 前边的公式，当 Xo 是均匀分布于[0，1)的实数时，我们求得 lnX „ 


的平均值为 


0 


ln^: F / n (x)dx = 


o 


nx f n (x )dxl (1 + x 


(52) 


其中 



n 


U ) 在 （33) 中定义。现在利用我们早先已经导出的事实（见习题 23) 可知: 


fn( 


X 


In 2 



0(2 


n 


(53) 


因此的平均值非常好地由 


ln 2 


In 


x 


o 


+ X 


djr 


In 2 


oo 


ue 


u 


0 1 



e 


ii 


a 


u 


In 2 


S (- i ) 


々+ 1 




^ ku \ 

ue au 


In 2 


1 - 


4 


+ 


1 




9 


16 + 25 


In 2 



4 


+ 


9 



» 參 ■ 


- 2 


4 


+ 


16 


十 


36 



2 In 2 



4 


+ 


9 





336 


參 




4.5 有理算术 


- 7 r 2 /( 12 In 2) 

所近似。因此由 （51) 我们期望有近似公式 

—1 (12 In 2) ^ - In N 

即，应当近似地等于 （（12 In 2)/7r 2 )ln No 这个常数 （12 in 2)/；r 2 = 0 . 842765913 


同早先所得到的经验公式 （50) 非常一致，所以我们有理由相信 




12 In 2 


In 


n 



1.47 


丌 


(54) 


当 


n 


〜时表示真正的渐近特性。 


如果假定 （54) 是正确的，则我们得到公式 


7； ^ ^~ l\n 

71 


n 



其中八 u) 是由规则 




Md ) 

d 



1.47 


(55) 


A( 


n 


In p 



如果对于素数的和 
否则 



^ 1 ~ p r 


(56) 


定义的 von Mangddt 函数（见习题27)。例如， 


T 


100 


^ 12 ln 2 I In 100 - ln 2 


7T 2 


2 


In 2 — ln 5 _ In 

丁 - 一 




25 



1.47 ^ 


(0.843)(4.605 - 0.347 - 0.173 - 0.322 - 0.064) + 1.47 ^4.59 


了 100 的精确值是4.56。 

通过计算 


N 


N 


El 


(57) 


我们也可以估计当“和 u 两者都均匀分布于1和 N 之间时除法步骤的平均次数 
假定公式 （55) ，习题29证明这个和有 


o 


12 { 2 2 In N + 0(1) 

丌 


(58) 


的形式，而且对用来推导等式 4.5.2-(65) 的同样的数进行的经验计算表现了同公式 


12 In 2 



n JV + 0 . 06 


(59) 


很好的一致。当然一般来说我们关于和还未曾证明任何 东西； 至今我们仅仅 

考虑了为什么上边的公式应当成立的可能的原因。幸而，根据好几位数学家的仔细 
分析，我们现在有可能提供严格的证明。 

在上边的一^些公式中，前导系数 （12 In 2)/7t 2 在 John D. Dixon 和 Hans A. Heil- 
bronn 独立研究下首先被确定了。 Dixon[ J. Number Theory 2 (1970) ， 414 〜 422 ] 建 

立了 KU) 分布的理论，证明了在适当的意义下，各部分商 基本上 是彼此无关的，而 
且证明了对于所有正的 f ，除在范围中的 m 和 n 的 exp(-cG). 
(log N)" 2 )]V 2 个值外，我们有 I TU，”）-((12 In 2)/7^111 n|<(ln n) (1/2) '其中 
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cG )>0。 HeUbronn 的方法十分不同，他完全利用整数而不是连续变量。他的思 ： 想 
在习题33和34中以稍微不同的形式给出，它是以可以在某种方式下同表示” 

的方式数有关这样一个事实为基础的。而且，他的文章 [Number Theory and Analy ¬ 
sis , Paul Turan 编辑 （New York : Plenum ， 1969) ， 87 〜 96 ] 表明，我们上边已经讨论的 

各部分商1，2,…的分布实际上可应用于有给定分母的诸分式所属的部分商的集 
合； 这是定理 E 的一个更明确的形式。若干年后， J . W . Porter 得到了更为深刻的结 

果 [Mathematika 22 (1975) ，20〜 28] ，他确定 


T 



12 In 2 
1— 


In r ? + C 十 O () 


(60) 


其中 1.46707 80794 是常数 


6 In 2 


(3 In 2 + 4 y - 24 丌 —（2) - 2) — 


丌 


2 


(61) 


见 D . E . Knuth ,Computers and Math , with 

(50) 就完全证明了。利用 （ 60 ) ， Grahan 


lie . 2 (1976)，137 〜139。于是猜测 

Norton [/• Symbolic Computation 10 


(1990)，53 〜 58] 推广了习题 29 的计算，证明在 (59) 中的经验常数 0.06 实际上是 


^4^(3 In 2 + 47 - 12 tc —(2) - 3)- 1 = 0.0653514259... (62) 

TT 

G . E . Collins ^SICOMP 3 (1974)，1〜10中证明了使用算术运算的经典算法， 


多精度整数的欧几里得算法的平均运行时间的阶为 

(1 + log(max( u y v)lgcd( u ,v)))\og min( u ,v) 


(63) 


小结我们已经发现了当输入〃和 u 是连续的斐波那契数时出现欧几里得算 
法的最坏情况（定理 F ); 当 0 < v<N 时除法步骤数绝不超过「4.8 log 10 N -0.32 lo 

我们已经确定各种部分商的值的频率，例如，证明了大约在41%的情况下除法步骤 

会遇到 LW ^」 = 1( 定理 E )。 最后， Heilbronn 和 Porter 的定理证明，当 ^二 ”时，平 

均除法步骤数 I ；近似地等于 

((12 In 2)/ tt 2 ) In ^ 1 . 9405 log 10 n 
减去如等式 （55) 中所示的以 n 的因子为基础的一个校正项。 


习 



► l.[20] 由于在算法 4.5.2A 中商 LWxJ 等于 1 的机会超过 40% ，所以在某些计算机上对于这 
个情况进行测试并在商为1时避免做除法可能是有利的。下面的欧几里得算法的 MIX 程序比程 


序 4.5.2 A 更有效吗? 


1 H 


LDX 

JMP 

STX 

SUB 

CMPA 


U 

2 F 

V 

V 

V 



w —rX 


rA.^—11 ~ v 


SRAX 
JL 
DIV 
2 H LDA 
JXNZ 


5 

2 F 

V 

V 
IB 


rAX^rA 

U 一 V 〈 V ? 

rX-^rAX mod v 

rA—u 

如果 rX = 0, 则完成 
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2 .[ M 21 ] 计算矩阵乘积 


3 .[ M 21 ] 行列式 



的值等于多少？ 

4. [ M 20] 证明等式（8)。 

5/ iHM 25] 设 A ，: r 2 ，…是一实数序列，它的每一个数都大于某一正实数〜证明无穷连分 
数// x'、xv II 二 lim„^co // Xi ，…， x ,, //存在。并且证明如果我们仅仅假定对于所有 j , Xj^O y 
// x ' yX : 、… II 未必存在。 

6.1 M 23] 如果&，丑 2 ，一是正整数，则无穷连分数//5 1 ，私，〜//是0和1之间的一个无理 
数 X ，对于所有；2>1，它的连分数有 A rl = B n 0 证明在这个意义下，一个数的正则连分数展开是 
惟 一的； 而且如果是正整数且 B , W >1， 则对于，对于 X = // B ,， …，民,// 
的连分数有人 , = B ,, 。 

■ 

7.1 M 26] 求整数 il ，2, …，;2丨的所有排列 p ( l )/> U ) …以72)，使得对所有 

K n ( x ^ ，:?: 2 ，…， : c ”） = /^(心⑴ ，•: r p (2 ) ，…，： c〆 ”）） 成立。 

5 . LM 20] 试证： 在正则连分数过程中，每当 X 7 , 有定义时， 

- 1/ X n = // A" ，…， A i ，- X // 

9.1 M 21] 证明连分数满足下列恒 等式： 

a) // yX n // = // ,x k + // // y l^k^n ; 

b) //0 9 X { y X 2 r t0 y^ Tl /Z = X { + // X 2 y mm% yX 71 // , U^\ ； 

C ) // x v , …， X k - {y X k , 0, I 々十 1 , X k ^ 2 y …， 工 n 丨丨二 " 工1，…，工卜 I ， 工 k + 工々 + 1， 
工走+ 2，…，工,/ //， 1<^<；2； 

d) \ _ II X X ,X 2 ,-'- ,X V // = // I ,Xy ~ \ ,X 2 y''' ,X n // , ”>1 。 

10. [ M 28] 由习题 6 的结果，每个无理实数 X 有形如 

X — Aq + // A ! ， A 2 ，>4 3 ，…// 

的惟一正则连分数表示，其中 a q 是一个整数，并且 ，/ \ 2 ， a 3 , …是正整数。证明如果 X 有这个 
表示，则对于适当的整数，…， B ~， l / X 的正则连分数是 

1 /X 二 Bo +// B L ，…，&， A 5 ， A 6 ，…// 

(. A 0 <0 的情况当然是最有趣的。）说明怎样借助于和 A 4 来确定诸 B 。 

■ 

11. [M：30](J.，A.Sen*et，1850) 设 X 二 A 0 + // A! ， A 2 ， A 3 ， A 4 ，… //和 Y = B 0 + // B { y B 2 , B 2 , 
_ b 4 ，… // 是在习题 io 的意义下，两个实数 x 和 y 的正则连分数表示。当且仅当对于某些使 | 识 
- r5 i - 1的整数 (?，r，5，“ 我们有 X ^( qY + r ) l ( sY + 0时，有对于某个 m 和《及所有々>0, 
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A ni + k = B n + ko 证明在这个意义下，这些表示“最终一致”。（这个定理是下列简单结果对于连分 
数表示的类似物，即当且仅当对于某些整数和 5， x 二 （ io 9 y + r ) iw 时，在十进系统中 x 和 
y 的表示才最终一致。） 

^12. [ M 30] —个二次无理数是形如 （/ 万 -（7)/ V 的数，其中 D ， L ； 和 V 是整数， D >0, V # 
0,且 D 不是一个完全平方。不失一般性，我们可以假定 V 是 D - U 2 的一个因子，因为否则这个 

数可以改写为 （/ W " 2 - u\v\)l(v\v\)o 

a ) i 正明一个二次无理数 X={^D ~ U ) IV 的正则连分数展开（在习题10的意义下）由下列 
公式 得到： 

V 0 = V , - A 0 — L X J , Uq = U + Aq V ； 

y„ + \ — (D — U 2 } , )1 V , } , A„ +! = L (\^~D + U „)! V n + \ \ ^ U „ + i = A，, + 1 V„ + 1 - 

b ) 证明对所有 n > N ，0< U rl <^/ D ,0< V „<2/ 乃，其中 N 是依赖于 X 的某个 整数； 因此每 
个二次无理数的正则连分数表示最终是周期的。[提示 ：证明 

(-/D - U)IV = A 0 +// ^ ，…人 ，- VJ(^/D + U ri ) // 

并使用等式 （5) 证明，当^很大时，（/万+ LT ，,）/ V ，, 是正的 Q ] 

c ) 设 = K „ + 1 ( A 0 ， A ! ，…， A ”） 和 g ,, 二 ( A , ，…， ) ，证明恒等式 + 2 Up n q n + 

((U 2 —D)/V)d = ( -ir + l v，, + L 。 

d ) 证明当且仅当无理数 X 是一个二次无理数时 X 的正则连分数表示最终是周期的。（当且 
仅当实数 X 是有理时， X 的十进展开最终是周期的，本题是上述事实在连分数中的对应定理。） 

13 • [ M 40] ( J . Lagrange , 1767) 设 /( x ) - a rr x ' + *•* + ao ， a „>0, 是有整系数的多项式，且没 

有有理根，恰好有一个实数根 6> lo 利用下列箅法（它实质上仅涉及加法），用一个计算机程序做 

实验， 来求彳 的头一千个左右的部 分商： 

L 1 •置 A — 1。 

L 2. 对于 A =0，1，."， t 7- 1( 在此顺序下）以及 j = n ~ I ，々（在此顺序下），置七― < a j + 1 + ^。 

(此步以 g ( x ) = /(工+ 1)代替/(:)，该是其根比 / U ) 的根小 i 的多项式。） 

L 3 •如果 + a ,, _ 丨 + …+ a 。 < 0，置 A—A + 1 并返回 L 2。 

L 4. 输出 A (它是下一个部分商的值）。以 （_ fl 。， -〜，…， - a „) 代替系数（〜，〜-!，•••，〜） 

并返回 L 1。 （这一步以其根是/的那些根的倒数之多项式来代替 / U )。） 

例如，以 jWoc l - l 开始，这个算法将输出“1”（把 /( ：0改变成 _ 3工 2 - 3^ - 1) ;然后 
“3”（把 /( i ) 改变成 10 x J - 6 x 2 - 6 x - 1) 等等。 

14. [ A /22]( A . Hurwitz ,1891) 证明当给定 X 的部分商时，下列规则使我们有可能来求 2 X 的 

正则连分数 展开： 

2 // 2 a , 6 , c , // ^ // a ,2 b + 2 // c 、…IIII 

2 // 2 a + l,b ,c // - // a ,1,1 + 2// b - 1，<: 〆 *• // // 

给定 （13) 中 e 的展开，使用这一思想来求 je 的正则连分数。 

15. [ A /3 i ]( R . W . Gosper ) 推广习题14,给定工的连分数々+ // a ， x 2 ，…//，并给定满足 ad 
^ bc 的整数 a ，6， C ， l 试设计一个算法，它计算（肛+ 6) /(以+ W 的连分数 X Q + // U 2 , …//。 
使你的算法成为“联机共行子程序”，在输入每个巧之前它输出尽可能多的说明当-1 + 
//5，1，1，1，2，1，2//时，你的程序如何计算(97_^ + 39)/(-62 1 2：-25)。 
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\6.[ HM 30] ( L . Euler ,1731) 设 / 0 ( 2 ：) = ( e z - e _ 2 )/( e z + e— z ) = tanh z ， 并设 /，, + 1 ( z ) = 1/ 
f „( z ) - (In + 1)/：^。 证明对于所有 n ，/„ U ) 是在原点的一个邻域中复变量 z 的一个解析函数，而 
且它满足微分方程/：(：0 = 1-/„“) 2 -2«人（2)/%试用这一事实证明 

tanh 2 ： - // z _1 ,3 z _1 ,52： -1 ,7 z _1 , ■■■ // 

然后应用 Hurwitz 规则（习题 14) 证明 

e - i/n — n 1， （2 m + 1)72 — 1,1//， m ^ 0 

(这个记法表示无穷连分数//1，《 - l ， l ， l ，3 n -1，1，1，5« - 1，1，…//。）并求当^ >0是奇数时 
e _2/ ” 的正则连分数展开。 

► 17. [ M 23] ( a ) 证明//〜， - i 2 // = //〜 - l ， l ， x 2 - l //。（ b ) 推广这个恒等式，得到对于 

// Xi , - X 2 yX 2 y ~~ _ A ，…， hn 的一个公式，其中当诸工为大正整数时，所有 

部分商都是正整数。 （ c ) 习题16的结果意味着 tan 1 二 // I , -3,5, -7, … //。试求 tan 1的正则 
连分数展开。 

■ 

IS .[ M 25] i 正明 // aiya 2} -^ a m yX l , a l 9 a 2 y- t ya ni 9 x 2 yai ， a 2 r m ^ a m 9 x 3 , … //-//‘ ，…， 

a 2 ，〜，:^ ，…， a 2 ，〜 ， i 2 ，，…， a 2 ， q ， _ r 3 ,…不依赖于 x Xy x 1 , x ^, ■** 0 提示：以 K m ( a Y , 

以，…，、 ） 乘两个连分数。 

19. [ M 20 ] 证明 FU )= b gz> (l + ：0 满足等式(24)。 

20. [ HM 20] 由 （37) 推导（38)。 

21. [/ /7 l ^29]( E . Wirsing ) 我们已经对于以丁 gU ) = 1 /U + 1) 对应于 g ■的一个函数 p 得到界 
(39)。证明当 c >0 是一个适当的常数时，对应于 7> U ) = l/(：c + c ) 的函数产生较好的界。 

22. [ HM 46] ( K . I . Babenko ) 对于小的^>3和对于 0<： c < l ，建立有效的手段来计算 （44) 中 
的量 A ； 和 ％( x ) 的精确近似。 

23 . [ HM 23 ] 利用定理 W 的证明中的一些结果证明（53)。 

24. [ M 22] 在一个随机实数的正则连分数展开中，一个部分商 A „ 的平均值等于多少？ 

25. [ HM 25] 找一个集合^ U / 2 U 7 3 U … C [0 , 1] 的一个例子，使得 （45) 对它不成立，其 

中诸 J 是不相交区间。 

26. [ M 23] 如果把数 | l / n ，2/〜 …， Lu /2」/ d 表达成为正则连分数，则每当 // A ^ A ^ …， 

//出现时 // A :， …，々2，/^//也出现。证明在这种意义下，结果的左右边是对称的。 


21. VM 21] 由 （49) 和 （54) 推导（55)。 

2 S . [ M 23] 证明下列涉及三个数论函数^(/0，^(«)，八(72)的恒等式 : 


a ) ' y ) ju ( d ) = S nl , b ) In ?? = ^ A ( d) y n = ^ j ( p ( d ) 

d \ n d\ n d \ n 


c ) A ( n )— 




n 


d\ 


71 


d 




29. [ M 23] 假定由 （55) 给出，证明 （57) 等于 （58)。 


► 30 .[/ / M 32] 经常有人提议欧几里得算法的下列“贪婪”形 式：若 m mod t ； >冬^;，则在进行 


除法步骤期间不是以 w mod r 代替 t ； 而是以 UmodtO - w 代替 w 于是，如果 w 二26和 t ； = 
7,则我们有 gcd (26,7) = gcd (- 2,7) = gcd (7,2) ; 当从26减去7的倍数时， -2 是 绝对值最小的 
余数。把这个过程同欧几里得算法进行 比较； 试估计这一方法平均节省的除法步骤数。 

► 31 .[^ 35] 找出习题30中提议的对欧几里得箅法所做修改的最坏 情况； 要求《个除法步骤 
的最小输人 W > V > 0是什么？ 
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32. [20] ( a ) 长度为 n 的一个莫尔斯代码序列是 r 个点和 s 根连字线的一个串，其中 r h 
n 。例如，长度为4的莫尔斯代码序列是 


注意连分数 Kjxi ，、 r2 ， q ，^4)是 工1工2工3工4 +工1工2 +工1工4 +工3工4 + 1， 找出并证明，…， 

X „) 与长度为72的莫尔斯代码序列之间的简单关系。 （ b ) ( L . Euler , Nov / Comm . Acad . Sci . Pet . 9 

(1762),53 〜 69) 证明 


K 


m + n 


X 


1 ， 


» » 




^7)1 + 


U 




X 


1 


X 


m 


) K n (x 


w + 1 



33 . 1 M 32 ] 设 / iU ) 是 n 的形式为 
整数）的表示的个数。 



^ m — \ ) K，i - 1 ( ^ + 2 y ，工 rw 十 w ) 


n — jo / + 30^’ d ^ , x ' > y 〉0, x ■ 上: y (工 


x y y ,y % 


a ) 证明如果把条件放松成为允许/二/，则表示的个数为 h ( n ) + l ( n ~ 1)/2」。 

b ) 证明对于固定的 3 ；> 0 和0< fy ， 其中^丄: v ， 且对于满足 oc ' t^n (modulo : y ) 的在0<^< 

WG + 〖）范围内的每个固定的/，恰有一个^的表示满足 a ) 的限制和条件 x modulo 30 。 

c ) 因此， A (”）= S 「 U/(_y + 0 -〖 Vd-LU — 1)/2」， 其中求和对所有使得山， 

3 S = 7? (modulo : y ) 的正整数 y ， t ， 〆 进行。 

d ) 证明 AU ) 的每一个表示都可惟一地表示成形式 

工 _ 尺(工1，…，工 m )， 3^ _ 

工 _ K I ； ( X w + i ， f + ^)^5 y _ -1(工，"+ 2 ，“’，工 m + d 

其中 m ， k ， d . 和々是正 整数， 且 d 是 n 的一个因子。 习题32 的恒等式现在意味 
着 nld = K … ( X '，…， x n) + k 、 。 反之，使得及 Ua ， …，、 u ) 整除 n 的任 
何给定的正整数序列^!，…， + / t , 都以这种方式对应于 m +々- l 个 n 的表示。 

e ) 因此，《了„ = L (5 ?7 — 3)/2」+ 2 / 1 ( 77 )。 


34. [ HM 40 \ ( H * Heilbronn ) 设 A〆 ) 是如题33所述的使得 •rdS ^的 77 的表示个数加上满 
^xd = /的表示个数的一半。 

a ) 设 g ( n ) 是不要求 x 丄: y 的表示数。证明 


,1(77) = g ( n ) = 2^ X (1) 

d \ n d\ n 

b ) 推广习题 33 b )， 证明对于 d > l , h d ( n )= T ,( nl ( y ( y + t ))) + ◦ U ) ，其中求和对所有使得 


艺丄》，0<〖<3^</”/^/的整数3^和〖进行。 

c ) 证明 ' ijy ^ 1 ( y I (y + t )) = ( p ( y ) In 2 + CKj — 〆 }))， 其中求和在范围 0< ，《丄7上进 

4了，而且 a - 1 ( ^ ) ~ 2 d \_ y ( l /<^)。 

d ) 证明 T t y = i < p ( y ) ly 2 = ' Z ^ l ft ( d ) H ll , ! dj ld 2 0 

e ) 因此我们有渐近公式 

T n = ((12 In 2)/ir)(ln n - ^ A(d)l d) + 0(a ^ y (tl) 2 ) 

d \ n 

35. [// M 4〗 ]( A . C . Yao 和 D . E . Knuth ) 证明对于 l < m <；7, 分数 min 的所有部分商之和等 
于 2( EU / y 」+ U /2」）， 其中的求和是对满足习题 33 a ) 的条件的所有表示 n 二 〆 + :进行。证 
明 21 ^/ 3 ^ = 37^ 2 ^111 n ) 2 +0 (n log ^ (log log « ) 2 )，并把这应用于欧几里得箅法的“古代”形式 
(它只使用减法而不用除法）。 

36. [ M 25] ( G . H . Bradley ) 如果始终使用欧几里得算法，则使得由算法 4.5.2 C 计算 
gcdUi ，…， w „) 要求/ V 个除法的最小的 、值是 多少？假定 N »3。 
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37. [ M 38]( T . S . Motzkin 和 E . G . Straus ) 设〜，…，是正整数。证明当 a 卜⑴》 a a p ⑵ 

- i )> …时，出现对于！ 1 ，2 ,…， n 1 的所有排列 p ( l ) … p (72) 的 max 1 s ⑴，…， 〜(„)); 当 

■ 

<^1)<%(„ ) <9 3) <^(„_ 2 )<9 5 )<〜<〜( 6 〉<〜〈„- 3 )<〜( 4 )<%(„_ 1 )<\( 2 )时出现极小。 

38. [ A /25]( J . Mikus — ki ) 设 LU ) = maD 0 nm ，”） o 证 F 证明了 L ( n )<：\ og ^5 n 十 1) 

— 2 ;证明 2 L ( 77 )> log 5 t ( A /5 W + 1 ) — 2。 5 

► 39. [ A /25]( R . W . Gosper ) 如果一个垒球运动员击球的平均次数是 .334, 他已经经历过的击 

球状态的最小次数是多少？[对非垒球爱好者的 说明： 击球平均次数 =( 击球数 ）/( 所处的击球状 
态次数）舍入到三位十进数。] 

► 40. [ M 28]( Stern - Brocot 树）考虑一个无穷二叉树，其中每个节点都以分数（九+ p r ) l ( q / + 

q r ) 来标号、 p ! lq ! 是节点最接近的左祖宗的标号，是节点最接近的右祖宗的标号。（左祖宗 

是在对称序下在节点之前的一个节点，而右祖宗在这节点之后。关于对称序的定义见 2.3.1 小 
节。） 如果节点没有左祖宗，则办/ 9/ = 0/1;如果它没有右祖宗，则 p r lq r ^ H 0 o 于是根的标号为1/ 

1;它的两个儿子的标号是1/2和2/1;在第2级上，自左至右的四个节点的标号是1/3,2/3,3/2和 
3/1;在第3级上，8个节点的标号是 1/4,2/5,3/5,3/4,4/3,5/3,5/2,4/1;等等。 

证明在每个标号中 P 与(？ 互素； 而且在对称序下以标号的节点在 〆 / 〆 标号的节点 
之前当且仅当这些标号满足心<，/ 〆 。试求出一个节点的标号的连分数和连接该节点的通路 
之间的联系，由此说明每个正有理数恰作为这树中一个节点的标号出现。 

41.[ Af 40]( J - ShaUit ,1979) 证明 
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的正则连分数展开仅含1和2而且有相当简单的模式。证明当/是任何大于或等于2的整数时， 

Liouville 数 ” •的部分商也有一个正则模式[由 J. Liouville ^£ J . de Math . Pures ef Appl . 16 

(1851),133-142 引进的这些数，是首先被证明为超越数的显式定义的数，前一个数和类似的常 
数最先是由 A . J . Kempner 证明为超越数的，见 TVans . Amer . Math . Soc 17 (1916)，476 〜 482] 。 

42. [ M 30] ( J . Lagrange , 1798) 设 X 有正则连分数展开 // A ! ， A 2 ，… // ，并设 ^ = 

( A !， … ，人）。设 II z II 表亦从工到最接近的整数的距离，即 minp x _ p 。 证明对于， 
II qX || > || LhX ( 于是所谓收敛数 pj q n = // A ly -- y A n // 的分母〜是“破记录”的整数，它 
们使 II II 达到新的低阶）。 

43. [ A /30]( D . W . Matula ) 证明当数 i >0不是可表示的时，对于开缝定点或开缝浮点数 ，“中 
间舍入”规则，即等式 4. 5.1-(1)可以简单实现如下 ：设： r 的正则连分数展开是以+ //七， 

a 2 y ■"// ，且设 A, 二 K” + i O 0 ，… ， a n ) ， q， t 二 K,,(a' ，…， ) 。则 round( jc ) ^ ( p i lq l ) ，其中 （/)" % ) ， 

是可表示的 ，但 （ p , + 丨）不是[提示：见习题 40] 0 


44. U /25] 假设我们正在用中间舍入做开缝定点数的算术运算，其中当且仅当 | w | <M 和0 

/ </ V 和 w 丄 z / 时，分式 （) 是可表示的。证明或否定：假定 t / < 且无溢出出现，则对 
于所有可表亦的 （ W :) 和 （ u / i /) 有 f 旦等式 （（《/ z /) ㊉ （ ly / tO ) ㊀ （ W /) = ( u I u ’） 0 

45. [ A /25] 证明当 oo 时，应用到两个„个二进位数的欧几里得算法（算法 （4.5.2 A ) 要求 
OU 2 ) 个时间单位（对于算法 4.5.2 B 同样的上限明显地成立）。 

46.1 M 43] 如果使用计算最大公因子的另一个算法，习题45中的上限 OU 2 ) 能否减少？ 
47.[ M 40] 当 x 是以高精度给出的一个实数时，试编制一个计算机程序来找出尽可能多的： r 
的部分商。使用你的程序来计算欧拉常数7的头数千位部分商，这可以如同 D . W , Sweeney 在 
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Math . Comp . 17 (1963) ，170〜178中所说明的那样来计算。（如果7是一个有理数，你可以发现它 
的分子和分母，由此解决一个有名的数学问题。按照正文中的理论，当给定的数是随机时，我们预 
测对于每个十进数字，我们得到大约 0.97 个部分商。多精度并不 必要； 请见算法 4.5.2 L 以及 J . 
W . Wrench ， Jr •和 D . Shanks 的文章， Mad . Cbmp . 20 (1966) ，444 〜 447。） 

48，:[期]令 T 0 二（1，0，《),乃=(0，1，。），‘..，7；, + 1 = ((-1)“、“，（一1广“以，0)是由算 

法 4 .5.2乂（扩充的欧几里得算法）计算出来的向量序列，并设//〜，一，、//是对于^心的正则连 
分数，对于 〃，借 助于涉及 <3 j , *'• - > a n 的连式表达 Ty 。 

49.[ A /33] 通过调整算法 4.5.2 X 最后的迭代 使得〜 任选地由两个部分商 （ a „ - 1，1)所代 

替，我们可以假定迭代次数 w 有一个给定的奇偶性。继续上道题，令 A 和^是任意正实数并令沒 
= V VWd ， 其中 d =- gcd ( u y v ) 0 证明，如果 n 是偶数，而且如果，％，~)，我们有 

min^i Xx } + — [j 偶] (9 < 沒。 

► 50. [ M 25] 给定一个无理数(0，1)及实数0和 y 且 0< p < y < l ， 设 / U ，#， y ) 是使得 
Kcm mod i < 7的最小非负整数 n 。 （由于习题 3.5-22 的 Weyl 定理，这样一个整数存在。）试设 
计计算 /( a ，/?，/)的一个算法。 

► 51.[ M 30] (有理数构造）在 316-28481 =41 的意义下，数28481将等于41/316 (modulo 
199999)。人们怎样发现它？给定整数 a 和 m 且 m > a > l ， 说明怎样求 整数工 和 3 /使得 

(modulo m ) ，: r 丄: y ，0< 工< V : m ./2 且| ：y | mil ，或者确定没有这样的 x 和 y 存在。能否有多 
于一个的解？ 

4 . 5.4 分解素因子 

在本书中我们已经遇到的好多个计算方法都以如下事实为根据，即每个正整数 
n 都可以用惟一的方式表达成 

”二 >1户2 … A ， 户1 < >2 < … < 九 (1) 

的形式，其中每个久为素数（当〃 =1时，等式对〖=0成立）。但不幸的是，找 rz 的 

这个素因子分解式，或者确定 n 是否素数，却不是一件简单的事情。现在已人人皆 
知，对一个很大的数72进行因子分解，比计算两个很大的数 m 和 rz 的最大公因子要 
困难 得多； 因此只要可能，我们就应该避免对很大的数进行因子分解。但是已经发 
现了某些用来简化分解因子问题的巧妙方法，我们现在就来研究其中的一些方法。 
[关于1950年以前因子分 解的丰 富历史已由 H . C . Williams 和 J . 0. Shallit 编述， 
Proc . Symp . Applied Math . 48 (1993)，481 〜 531 。： 

除法和因子 首先我们考虑最明显的分解因子算法 ：如果 〃 >1，则我们可以用 
素数 P =2,3,5, …来逐个地除 r /， 直到发现使得 n mod p = 0 的最小的 p ， 则这个 p 
就是； 2 的最小素因子，而且同一过程可被应用于 72—• n / p ， 以图用 > 和更高的素数 
来除 72 的这个新值。如果在任何阶段我们求得 77 mod /但，则我们即 

可得出72是素数的结论；因为如果72不是素数，则由 （ 1 )，我们必有，但 pi > 

P 意味着 Pi^(p + l) 2 >/?(/j + l )>/) 2 + (n mod p )^\_ n/p j p + (n mod p ) = n 0 
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这把我们引到下列过程: 
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算法 A (通过除法进行因子分解） 给定一个正整数 N ， 这个算法找出等式 （1) 
中那样的 iV 的素因子这个方法利用了一个辅助的“试验因子”序 

列 

2 = do <C d \ < di <^3< "** (2) 

它包括小于或等于 # 的所有素数（而且它也可以包括不是素数的值，如果这样做 
适宜的话）。这个^的序列至少必须包括一个使得的值。 


A 1 • [初始化]置 t —0 ， k —0 ， n — N 。 (在算法执行期间，变量 t，k , n 通过条 

件 “72 = iV / h …九和 n 没有小于< 的素因子”相关。） 


A 2. [n =1?] 如果；7=1，则算法终止。 

A 3. [除]置 q ^~ Vn \ d k 」， r — ” mod 心 （ 这里9和 r 是当”除以4时得到的商 


和余数）。 

A 4. [余数为 0?] 如果则转向步骤 A 6。 

A 5. [已找到因子] Z 增加1，置九 — <，置 w —g ，返回步骤 A 2。 

A 6. [低的商？]如果 g > A ，则 6 增加 1 并返回步骤 A 3。 

A 7 [72 为素数] Z 增加1，置 A — ”， 并终止此算法。 ■ 



作为算法 A 的一个例子，考虑数 N = 25852的因子分解。我们立即求得 n 二 
2 X 12926; 因此 p x ^2 o 而且，12926 = 2 X 6463,所以九= 2。但现在6463不为2, 

3，5,…，19所 整除； 我们发现 二 23 X 281，因此 p 3 = 23。 最后281 = 12 x 23 + 5且 

12<23;因此^ 4 = 281 0 这个确定25852的因子的过程总共含12个除法 运算； 另一 

方面，如果我们试图对稍小的数 25849( 它是素数）进行因子分解，至少要执行38个 

除法运算。这说明算法 A 要求大略同 max (九 _ M v ^) 成比例的运行时间。（如果 
/ = 1，而且我们采取 p 0 = l 的约定，则这个公式是正确的。） 
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在算法 A 中所用的试验因子序列，心，，…可以简单地取作2,3,5,7,11, 

13，17，19,23,25,29,31，35,…，其中在头三项过后，我们交替地加2和4。这个序列 
包含了不是2和3的倍数的所有数，也包含诸如25,35,49等等不是素数的数，但这 
个算法仍将给出正确的答案。通过从这个表中删去数 30 m ±5( m > l ) 可以消去5 
的所有多余倍数。这就可进一步节省20%的计算时间。排除7的倍数可使这个表 
缩短14%以上，等等。可以用一份紧凑的二进位小表来控制试验因子的选择。 

如果已知 iV 很小，则具有一份所有必要的素数的表作为程序的组成部分是合 
理的。例如， N 小于一百万，则我们只需要小于1000的168个素数就够了（在 N 是 
大于997 2 的素数的情况下，可以加上值心 68 = 1000来终止这个表）。可以借助一个 

简短的辅助程序建立这样一个表。例如，请见算法 1.3.2 P ， 或见习题8。 

算法 A 中需要多少试验因子呢？设是小于或等于1的素数的个数，则 
Tr (2) = l ，; r (10)=4 ; 1798 年自 Legendre (勒让德）开始，世界上许多伟大的数学家已 

广泛研究了这个函数的渐近特性。在19世纪期间取得了许多进展而以1899年达 

到顶峰，这一年 Charles de La V allee Poussin 证明，对某个 A > 0， 

ttU ) = P ? ^十 OUe —(3) 

J 2 In it 

^ Mem . Couronnes Acad . Roy . Belgique 59 ( 1899) ， 1 〜 74; 也见 J • Hadamard jBull . Soc . 

Math . France 24 (18%) ， 199 〜 220。] 由分部积分得到，对所有固定的 r ^ O , 



⑶中的误差项随后已被 改进； 例如，它可以用 O ( x exp (- A (log x ) 3/5 / 

I / 5 t - I- 

(log log x ) ' )) 所代替[见 A . Walfisz , Weyl 9 sche Exponentialsummen in der neueren 

Zahlentheorie (Berlin : 1963) ， 第 5 章。] Bernhard Riemann 在 1859 年猜测 

?!(：£•)= 2 A (: )L d) + 0(1) = L ( x ) - 士 L(V^) - (v^r ) + *■• + 0(1) 


(5) 

其中 L (^)= Z ，当： r 大小适当时他的公式同实际的计算很吻合。例如，我 

J 2 

们有下列的表（请见习题 41): 


10 3 

10 6 

10 9 

10 12 

10 15 

10 18 


168 

78498 

50847534 

37607912018 

29844570422669 


L ( x ) 

176.6 
78626.5 
50849233.9 
37607950279.8 
2984457147528&5 


黎曼公式 
168.3 

78527.4 

50847455.4 

37607910542.2 


29844570495886.9 
24739954287740860 24739954309690414.0 24739954284239494.4 
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但是，大素数的分布不是这样简单， 1914 年 J . E . Littlewood 否定了黎曼的猜想 （5); 
见 Hardy 和 Littlewood,Acta Math . 41 (1918)，119 〜 196，其中证明了对于无穷多的 

工有 一 个正常数 C 使得 tt(x)> L ( x ) + C 4 x log log log x I log z。Littlewood 的结 

果表明，素数在本质上是有些神秘的，因而在真正地了解它们的分布之前，有必要发 
掘出深刻的数学特性。黎曼作出了另一个更为可信的猜想，即著名的“黎曼假设”。 
他指出，除了在^是一个负偶整数的平凡情况外，仅当2的实部等于1/2时，复函数 

S ( Z ) 为零。 如果这个假设为真，则意味着 7： ( x ) - L ( x ) + 0( \Tx log ) ;见习题 
25 。 Rkhard Brent 使用了 D . H . Lehmer 的一个方法，对于所有“小”的 z 值从计算上 
验证黎曼的假设，他的方法是证明当虚部的范围是0<3^< 32585736. 4时正 

好有75 000 000个0;所有这些0都有9^ = +而 ^ ( z )^0[ Math . Comp . 33 

(1979),136 卜1372]。 

为了分析算法 A 的平均特性，我们希望知道最大的素因子 A . 将趋于多大。这 

个问题首先是由 Karl Dickman 研究的 [Arkiv for Mat . ， Astron . och Fys . 22 A , 10 

(1930),1 〜 14], 他研究了在 1 和 x 之间的随机整数的最大素因子小于或等 于/的 
概率。 Dickman 利用启发式方法论证，当 ： r 时这个概率趋向于极限值 FU )， 其 

中 F 可以从函数方程 

F ( a ) = fVf -— ,当 a < 1 时； FU ) = 1，当 a > 1 时 （6) 

Jo _ t I t 

计算出来。他的论证实质上是这样 ：给定 0< r < i ， 最大素因子处于 y 和， + d/ 之间 
的小于2的整数之个数是 xFl 0心。在该范围内素数的个数是; r (2 +df ) - 
tc ( x 1 ) = zix 1 + (In x ) x t dt ) - k ( x 1 ) — x l dtl t 0 对于每一^个这样的 />，使得 

且72的最大素因子小于或等于//’的整数 n 的个数是小于或等于:的72的个数， 

这些数的最大素因子小于或等于，即 x v - l F { tKi - t )) 0 因此， ifU ) 
dt = ( x t dtlt )( x i - t F ( tl(l - r )))， 通过积分可得（6)。这种启发性论证可以严格 
化； V . Ramaswami [ Bu / i . Ame_r Math . Soc , 55 (1949 )，1122 〜 1127 ] 证明，当 ： r — 00 

时，对于固定的 a ， 上述问题中的概率渐近地为 F ( a ) + 0(1/ log X )，许多其他作者 
已经推广了这 一 分析[见 Karl K . Norton 的综述 ， Memoirs Amer . Math . Soc . 106 
(1971)，9 〜 27]。 

如果公式 （6) 简化成为 

F ( a ) = 1 - \ l F ( zr ^)— = 1 - P — = 1 + In a 

」&\丄 t j t ^ Cl ^ 

因此，比如说，小于或等于： r 的随机整数有大于▲的一个素因子的概率是1_ 
F (冬 ) = In 2，即大约69%。在所有这样的情况下，算法 A 必须费尽气力来工作。 
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这一讨论的纯结果是，如果我们想要分解一个六位数，算法 A 将较快地给出答 
案; 但对于很大的 N ， 除非我们意外地走运，不然用试验除法进行因子分解的计算机 
时间将迅速地超过实用的极限。 

在本节的下面一部分我们将看到，有相当好的方法来确定一个相当大的数„是 

否素数，而不必试验直到^之前的所有因子。因此如果我们在步骤 A 2 和 A 3 之间 
插人一个素性测试，算法 A 通常将运行得 更快； 这个改进了的算法的运行时间大体 

上同 Ay 成比例，这就是 iV 的第二大的素因子，而不是 ms . x ( p t _ ly / J t ) 0 通过类 

似于 Dkkmari 的论证（见习题18)，我们可以证明，一个小于或等于： r 的随机整数的 

第二大素因子小于或等于/的近似概率为 G (/?)， 其中 

G( ^ = 1I( G (^7)- F (r^))r- 0 <^< 1/2 ⑺ 

显然，对于 /?>1/2， G (/?) = 1( 见图12)。 （6) 和 （7) 的数值计算产生下列的“百分 
点、 


F(a) ,G(/?) - .01 .05 . 10 .20 .35 .50 .65 .80 .90 .95 .99 

.2697 .3348 .3785 .4430 .5220 .6065 .7047 .8187 .9048 .9512 .9900 

^ .0056 .0273 .0531 .1003 .1611 .2117 .2582 .3104 .3590 .3967 .4517 

因此，第二大素因子将有大约一半的时间小于或等于 X 2117 ，等等。 



图12小于或等于 X 的一个随机整数的两个最大素因子的概率分布函数 

素因子 的总数 〖也已被广泛地分析了。显然 l < z<lg / V ，但是这些下限和上限 
很少达到。有可能证明，如果 N 在1和： r 之间随机地选择，则当： r — ^时，对任何 

固定的 c , ^ ^ln In + c In In jc 的概率趋向于 

e - 气 (8) 

换句话说 ，（ 的分布实质上是正态的，且均值和方差为 In In x ; 所有小于或等于 x 的 

大整数中大约有 99.73 %有 Ir - In In ^ | <3 7 In In x o 而且，已知对于 l < iV <: r ， 
^ - In ln ^: 的平均值趋于 
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7 + S Gn(l -紗 1心 _ 1)) = 7 + S ^ U) ^ U) 二 

/>素数 ，，>2 

1.03465 38818 97437 91161 97942 98464 63825 47603 + (9) 

[参考 G . H.Hardy 和 E . M . Wright,An Introduction to the Theory of Numbers ， 第 5 

版 （ Oxford ,1979)，§22.11; 也见 P . Erd 從和 M . Kac ， Amer . J . Math . 26 (1940),738 
〜 742。] 

素因子大小同排列有显著的联 系：当 72—⑺时 ，一 个随机的〃个二进位整数的 
第 k 个最大素因子中平均的二进位数渐近地和一个随机”元排列的第&个最大循 

环的平均长度相同[见 D . E . Knuth 和 L . Trabb Pardo , Theoretical Comp. Sci. 3 
(1976) ,321-348; A . M . Vershik , Soviet Math.Doklady 34 (1987) ， 57 〜 61 ] 。由此 
得出，算法 A 通常先得到一些小因子而后开始对剩下的一些大因子进行漫长的查 
找。 

Patrick Billingsley 对一个随机整数的素因子的概率分布给出了精彩说明，见 
AMM 80 (1973) ，1099〜 1 U 5; 也参见他在 Annals of Probability 2 (1974) ，749 〜 791 

的文章。 

通过拟随机周期的因子分解 在靠近第3章的开始处，我们发现“随机选择的 

一 个随机数生成程序并不很随机”。在这一章里再次面对我们的这一原理有赎罪式 
的性质。经 J . M . Pollard 发现[说了 15 (1975),331 〜 334]，它导致一个令人惊讶的 

有效的因子分解方法。在 Pollard 的方法中的计算步骤数有 #了 1 的阶，所以当 N 

很大时，它比算法 A 要快得多，按照 （7) 和图12,运行时间通常将是在 N 1/4 之下。 

设 /( x ) 是带有整系数的任何多项式，并考虑由 

x 0 = y 0 = A ; x m + [ = f { x m ) mod iV ， y m + l = f ( y m ) mod p (10) 

定义的两个序列，其中 p 是 N 的任何素因子，由此得出 5 对于 m^ly 

二 0 C m mod p (11) 

现在习题 3.1-7 表明对于某个 m > l ， 我们将有 3 V = 其中/(讲）是小于或 

等于的2的最人/久。于是 X _ 工彳 ( w ) - 1 将是 P 的一个倍数。其次，如果 f ( y ) 
mod p 的特性是从集合 i 0， l ， …，户 -11 到它自身的一个随机映像，则习题 3.1-12 表 

明，最小的这样的 w 的平均值将有办的阶。事实上，下边的习题4表明，对于随机 

映像，这个平均值小于 1.625 Q ( p ), 其中函数 Q ( p ) 是在 1.2.11.3 小节 

中定义的。如果 iV 的不同素因子对应于 m 的不同的值（因为当 N 很大时，它们几 
乎肯定如此），则我们可以对于 m = l ，2,3, …来计算 gC dU w _ + 直到未 

分解的余数为素数时为止。 Pollard 把他的技术称做 “ p 方法”，因为像3^，…这样 

一个最终周期性的序列让人想起希腊字母 P 。 

由第3章的理论，我们知道，就我们的目的而言 ，一 个线性多项式 f(x) = ax + 

c 将不是充分随机的。次最简单的情况是二次的，比如说， / U ) =工 2 + 1。尽管我 
们不知道这函数是充分随机的，我们的无知势必支持随机性的假设，而且经验测试 
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表明，这个/实质上是如所期望的那样有效。事实上，/大概比随机稍好一点，因为 

: r 2 +l 只取^~(/> + 1)个不同的模 值。请见 Arney 和 Bender ， Pacific J . Ma til . 103 

(1982)，269 〜294。因此下列过程是合理的。 

算法 B (通过 p 方法的因子分解）此算法以很高的概率输出一个给定整数 / V > 
2的素因子，尽管它有时会失败。 


B 1 • [初始化]置 : r — 5，: r '— 2 — — 在此算法执行期间， n 是 iV 

的未分解部分，而变量： c 和/表示 （ 10) 中的量 ： r w mod n 和: mod 

”，其中 /(:r) = :r 2 + l ， A =2，/ ; =/( m )，々=2/ _ m ) 0 

B 2 .[素性检验]如果 n 是素数（见以下讨论），则输出〃；算法结束。 

B 3 .[找到因子？]置 g — gcd (/- u )。 如果 g = l ， 则转向步骤 B 4; 否则输出 
g 。 现在如果 n ， 则算法结束（而且它已经失败，因为我们知道 n 不是素 

数），否则置 n — n 丨 g ， 工 — x mod n , x x ； mod ?? ， 并返回步骤 B2 。 （注意， 

g 可能不是 素数； 这应当加以检验。 万 一 g 不是素数，它的素因子大概不能 
用本算法确定。） 

B 4 •[前进]置众—々 _ 1。如果々 = 0,置 jt ，/—2 Z ，々 — /。置 oc 1 + 1 ) 
mod n 并返回 B 3 0 I 


作为算法 B 的一个例子，我们再次试验分解 N = 25852。 第三次执行步骤 B 3 
将输出 g = 4( 它不是素数）。继续迭代6次之后本算法求得因子 g = 23。 在这个例 
子中，算法 B 的效果并不突出，当然它是为分解大的数而设计的。算法 A 花费长得 
多的时间来求大的素因子，但当它消除小的素因子时，它是最佳的。实用上，在转到 
运行算法 B 之前，我们应当先运行算法 A —段时间。 

考虑10个最大的6位素数，我们能对算法 B 的杰出本领有更好的了解。在下 
面的表中给出了算法 B 为求素因子 f 所需要做的迭代次数 

999863 999883 999907 999917 999931 999953 999959 999961 999979 999983 

m(p)= 276 409 2106 1561 1593 1091 474 1819 395 814 


实验指出，当户<1000000时， m ( p ) 的平均值大约为2/7,而绝不超出12斤。对 
于户<10 6 ,极大的 是 m (874771) = 7685;而且当 p = 290041, m ( p ) = 6251 


时， 


7)1 


)/ V ^ 的极大值出现。按照这些实验结果，几乎所有12位数的因子分解都 


可以用算法 B 以少于2000次迭代来完成（同算法 A 的大约75 000次除法相比) 


o 


在算法 B 的每次迭代当中 ，最花 费时间的运算是步骤 B 4 中的多精度乘法和除 

法，以及步骤 B3 中的 gcdo “Montgomery 乘法”技术（习题 4 .3.1-41 ) 将使这加快。 
如果 gcd 运算较慢， Pollard 提议在取每个 gcd 之前，累计比如说 10 个相继的（ 


X 


: r ) 值的乘积模〃，以提高速度。这样做能以一个乘法模 N 代替90%的 gcd 运算，而 


仅仅稍稍增加一点失败的机会。他也提议在步骤 B 1 中以 m = g 而不是 m = 


开 


始，其中 g 比如说是你打算使用的迭代次数的 


10 
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在对于很大的 iV 出现失误的稀少情况下，我们可以对某个或1，用 
/ U ) = I 2 + C 进行试验。也应避免值 c = -2,因为递推式 x w + 1 = : rt - 2有形如 

^ m >/! 

= r 2 + r ' 2 的解。 c 的其它值似乎不导致简单的关系模 p ， 而且当对适当的开 
始值使用它们时，应当都是令人满意的。 

Richard Brent 使用算法 B 的一个修改发现2 256 + 1的素因子 
1238926361552897 0 [请参见 Math . Comp , 36 ( 1981 )，627〜630 ; 38 (1982)，253〜 
255。] 

费马方法 分纟因子问题的另 一 ^个方法是由 Pierre de Fermat (费马）于1643年 
使用的。相对而论，它更适合于求大的因子，而不是求小因子。[费马关于他的方法 

的最初描述已译成英文， p 」 以在 L . E . Dickson 的不朽之作 History of the Theory of 
Numbers 1 (Carnegie Inst , of Washington 1919),357 中找到。] 

假定，其中为实用起见，我们可以假定 TV 是 奇数； 这意味着^ 
和^都是奇数，我们令 

x - (u + v )/2 , y = (v - u )/2 (12) 

N = x 2 ~ y\ O^y < x < N (13) 

费马的方法的要点是系统地寻找满足等式 （13) 的 JT 和^的值。因此下边的算法说 

明怎 样 可以不 使用任何除法 来进行分解。 

算法 C (用加法和减法进行分解） 给定奇数 N ， 本算法确定小于等于#的 
N 的最大素因子。 

C 1 •[初始化]置: r — — — Lv ^ f - N 。 （在此算法执行期 

间，当我们寻找 （13) 的一个解时 , x y y , r 分别对应于+ 1,2^ + x 2 ~ 

: y 2_ N ; 我们将有 I r | < j ： 和 3 ；< x 。） 

C 2 •[完成了吗？]如果 r = 0, 则算法 结束； 我们有 

N = ((x - y)/2)((x + ：y - 2)/2) 

因此 （: r - y)/2 是小于或等于#的 N 的最大因子。 

C 3 •[步进： r ] 置 r — r + :r 和 x^~x + 2 。 

C 4 •[步进 y ] 置 厂―厂 ―汐和）—）+ 2。 

C 5 •[测试 r ] 如果 r >0 则返回步骤 C 4, 否则转回 C 2。 ■ 

用手来做这个算法求377的因子，读者可能会感到有兴趣。为了求 N = 的 
因子 w 和所需步骤实际上与 （jc + y _ 2)/2 - 」 T - v ~ \_ a / N 」成比例，这当然可 

能是一个很大的数，尽管在大多数计算机上每一步都可以非常快地完成。 R . S . 

Lehman 作出了一项改进，它在最坏的情况下只需要 O ( N 1/3 ) 次运算 [ Math . Comp . 

28 (1974),637 〜646]。 

把算法 C 称做“费马方法”是不十分正确的，因为费马使用的是一个更精简了的 
方法。算法 C 的主循环在计算机上是十分快的，但用手算却不很合适。费马实质上 
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并不保持3；的运 行值； 他的做法是观察 JT 2 _ 并且通过观察它的最低有效数字来 
猜测这个量是否完全平方（一个完全平方的最后两位数字必须是 00， el ， M ，25, o 6 
或 A ， 其中 e 为偶数而。是奇数）。因此他避免执行步骤 C 4 和 C 5, 而代之以有时确 
定某个数不是 一 个完全平方。 

当然观察最右边的数字的费马方法可以用取其它模来加以推广。为明确起见， 
假设 iV = 8616460799,并考虑 下表: 



如果 ： mod w 为 
0 , 1,2 
0 ， i ， 2,3,4 
0,1,2,3,4,5,6 
0,1,2,3,4,5,6,7 
0 ， 1 ， 2,3,4,5,6,7,8,9，10 


则 jc 2 mod m 为 

0,1,1 

0,1,4,4,1, 
0,1,4,2,2,4,1 
0 ， 1 ， 4 ， 1 ， 0 ， 1 ， 4，1 
0 ， 1 ， 4,9,5,3,3,5,9,4，1 


且 (i. 2 - A’）mod m 为 
i ， 2,2 

1 , 2 , 0 , 0,2 
5,6,2,0,0,2,6 
1 ， 2,5,2 J ， 2,5,2 
10,0,3,8,4,2,2,4,8,3,0 


如果： r 2 - N 是一个完全平方 y 2 , 则对于所有 m ， 它必定有同这个事实一致的模 m 
剩余。例如，如果 N = 8616460799和 : r mod 3判，则 U 2 - N ) mod 3 = 2,所以 x 2 - 

不能是一个完全 平方； 因此每当 N = ： c 2 - /时工必定是3的倍数。事实上，这 
个表告诉我们： 


x mod 3 = 0 
x mod 5二0，2或3 

x mod 7 = 2,3,4或5 (14) 

x mod 8 = 0或 4( 因此 ： c mod 4 = 0) 
x mod 11 = 1，2，4，7，9或 10 

这就相当地缩小了寻找： T 的范围。例如 ，： T 必须是12的倍数。我们必须有 

x > Lv /^」= 92825, 因此12这样的最小倍数是92832。这个值模 （5 ，7，11 ) 分别有 
剩余(2,5,3)，所以相对于模11它不满足（14)。 x 增加12使模5剩余改变2,模7 
剩余改变5,而模11剩余改变1;所以容易看到满足 （14) 中所有条件的大于等于 
92825的头一个: r 值是 : c = 92880。 现在92880 2 - N = 10233601，而求平方根的纸笔 

方法告诉我们10233601 = 3199 2 确实是一个完全平方。因此我们找到了要求的解 

x = 92880 = 3199,因而因子分解是 

8616460799 = (x - ^(工十3 ; ) = 89681 • 96079 

N 的这个值是有趣的，因为英国经济学家和逻辑学家 W . S . Jevons 在一本非常 
有名的书中对它作了如下的介绍，给定任意两个数，通过一个简单和确实可靠的过 
程我们可以得到它们的乘积，但是当给定一个很大的数来确定它的因子时，那就完 
全是另一回事了。读者能够说出哪两个数相乘将产生出数8 616 460 799吗？我 

想，除了我之外不大可能有谁竟会知道它。” [了心 Principles of Science ( Macmillan , 

〖874)， 第 7 章。]然而，我们已经看到，费马在一个信封的背面，用了不到 10 分钟，就 
把 /V 给分解了。 J evens 关于因子分解相对于乘法的困难的主要论点是切中要害 
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的，但是那仅仅在形成彼此不相靠近的数的乘积时才如此。 

不用 （14) 中所考虑的模数，我们可以使用不同素数的任何乘幂。例如，如果用 
25代替5,我们将发现 ，: r mod 25的值只能为0，5，7，10，15，18和20。这就比 （14) 
给出更多的信息。 一 般来说，对于奇素数 >，每当 、 r 2 - N ^0 (modulo />) 有一个解 
x 时，比起模来，模 〆 将得到更多的信息。 

刚才所用的模数方法称为筛选过程，因为我们可以想像所有的整数都通过一个 
“筛”。对于这个筛来说，只有满足 ： r mod 3 = 0的那些值能出来，然后把这些数移到 
只允许 f I 足工 mod 5 = 0,2或3的数通过的另 一 个筛上去，等等。每个筛本身都将 
删去大约余下的数的一半（见习题 6); 而且当我们相对于两两互素的模数来筛时， 
由中国剩余定理（定理 4.3.2 C )， 每个筛是同其它筛无关的。所以如果我们相对于 
(比如说30个）不同的素数进行筛选，在每2%个数当中将仅仅大约有一个值需要加 
以考察，以看看 x 2 ~ N 是否为完全平方 

算法 D (用筛进行分解）给定奇数 N ， 本算法确定小于等于#的 N 的最大因 
子 o 本过程使用两两互素的且与 iV 互素的模 m ! ，772 2 ，…，。对于 

i < r ， 假定我们可以访问 r 个筛表 S [ ^ ] ，其中 

S [ z ‘ ， j ] 二 [ j 2 - iV — y 2 ( modulo ) 有 一 个解 ： y _ 

D1 • [初始化]置 J ： 叫1,而且对于 置 k 〖一（ _ x ) mod ⑺ , (在此算 

法中下标变 S k { f k 2 r ^ yk r 将被置成^ ■ = ( - x ) mod m 7 ) 。 

D2 •[ 筛 ] 如果对于 1< 2 < 厂， 5[2 ，心 .]=1 ，转向步骤 04 。 

D3 . [ 步进 ： r ] 置 x^x + 1，而且对于 r ， 置 k^ikj - 1 ) mod m , : ，返回步 

骤 D 2。 

D4 •[检验 j ： 2_ iV ] 置 y — L V x 2 — N 」或 「V x 2 ~ N ] o 如果 jy 2 = x 2 _ TV ， 

贝 -30 是所需因子，算法 结束； 否则返回步骤 D 3。 | 

有若干种方法使这个过程运行得更快。例如，我们已经看到，如果 N mod 3 = 
2,则： r 必定是3的 倍数； 我们可以置 ： c 二 3/，并使用对应于/的不同的筛，把速度 
增加三倍。如果 iV mod 9 = 1，4或7,则： r 必须分别同余于±1，±2或 ±4( 模 9); 所 
以我们使用两个筛（一个是对于/的，而另一个是对于： r 〃的，其中 + a 和 : c 

= a) ，以把速度增加 4 +倍。如果 N mod 4 = 3, 则： c mod 4 已知而且速度进 

—步增加4 倍； 在其它情况下，当 mod 4 = 1时，: r 必须是奇数，以便速度可以加 
倍。使本算法的速度加倍的另一方法（以存储空间为代价）是组合成对的模数，并且 

对于使用 m r - k m k 代替％。 

加速算法 D 的一个甚至更为重要的方法是使用在大多数二进计算机上使用的 
“布尔运算”。例如，我们假定 MIX 足每个字有30位的一台二进计算机，表 SU . k ,] 

可以保存于内 存中； 每项只用 一位； 于是30个值可以存入一个字中。对于 
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30,如果内存中一个特定字的第々个为0,则 AND 运算用0代替累加器的第々位，于 
是 MD 可以一次用来处理 x 的30个值！为方便起见，我们可以复制若干个 S [ i yJ ] 
表，使得 m , 的表项含 [。01(7^，30)位； 然后每个模的筛表填满整数个字。在这些假 

定之下，30次执行算法 D 中的主循环等价于下列形式的 代码： 

D 2 LD 1 K 1 rll 一々； 

LDA Sl,l rA — S ’ tl ’ rll ] 

DEC 1 1 rll—rll — 1 

JINN *+ 2 

INC 1 Ml 如果 rll <0 ，则置 rll—rll 十 lcm ( 772】 ，30) 

ST 1 K 1 

LD 1 K 2 rDZ — h 

AND S2，l rA^-rAA S / [2, rIl ] 

DEC 1 1 rll—rll —1 

JINN *+ 2 

工 NCI M 2 如果 rll < 0 ，则置 rll—rll 十 lcm ( m2 ， 30) 

ST 1 K 2 々 ‘—rll 

LD 1 K 3 rIl^-^3 

… （ m 3 到与类似） 

ST 1 Kr 々: — rll 

INCX 30 : r—x + 30 

JAZ D 2 如果全都筛完，则重复 _ 

30次迭代的循环次数实质上是 2 + 8r ; 如果 r = 11，这意味着在每次迭代中使用三 
次循环，恰如在算法 C 中那样，而且算法 C 还多包含另外 y = 幻次迭代。 

如果 的表项未充满整数个字，就要在每次迭代时进一步移动表项，以便适当 

地调整二进位。这将往主循环附加上大量的代码，而且它大概将使这个程序太慢， 
因而比不上算法 C ， 除非 W ^<100( 见习题7)。 

筛过程可以应用于大量其它的问题，而不必要做许多算术运算 。 Marvin C . 
Wunderlich 编写了关于这些技术的一个评述，见 JACM 14 (1967) ，10〜19。 

F . W . Lawrence 在19世纪提出了用于因子分解的特殊筛机器的构造 [ Quart . 
of Pure and Applied Math . 28 (1896) ,285 〜 311 ] ，而 E . O . Carissan 于 1919 年使用 14 

个模完成了这样一个装置[关于 C a r . i SSan 遗失了很久的筛如何被重新发现并流传后 
世的有趣故事，请参见 Shaliit ， Williams 和 Morain , Math . Intelligencer 17, 3(1995)， 
41 〜 47]。 D . H . Lehmer 和他的助手们在1926年一 1989年期间构造和使用了许多 
不同的筛装置，他们从使用自行车链开始，而后使用光电单元和其它类型的 技术； 
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比如，参见 AMM 40 (1933) ，401〜406。 Lehmer 的电子延迟线筛1965年开始操作， 
每秒处理100万个数。到1995年，有可能构造每秒筛 61.44 亿个数的机器，在大约 

5.2 ns 中执行256次步骤 D 2 和 D 3 的迭代[参见 Lukes ， Patterson 和 Williams , 
Nieuw Archief voor Wiskunde (4) 13 (1995 ) ， 113 〜 119 」。 D . H . Lehmer 和 Emma 
Lehmer 在 Math. Comp, 28 (1974) ， 625 〜 635 上描述了用筛进行因子分解的另外的 
方法。 


素性检验 至今我们所讨论的算法，没有一个是确定一个很大的数 n 是否素数 
的有效方法。幸而解决这个问题还有其它方法可用，它 . Lucas 和其他人，主要是 D . 
H . Lehmer 已经给出 了一些有效的方法[见 Bull. Amer. Math. Soc . 33 (1927) ， 327 〜 


340 ] 0 


按照费马定理（定理 1.2.4 F ), 每当为素数和 x 不是 f 的倍数时，我们有 


x p 


— 1 


mod p 




1。而且有有效的方法计算 ^^ l mod n ， 且只需要 0 (log n ) 个模 n 乘 


法运算（我们将在下边的 4.6.3 小节研究它们）。因此我们通常可以确定，当这个关 


系不成立时， n 不是素数。 ’ 

例如，费马曾经证明数 Zi + ljS + Uj + ljS + l 及2 16 + 1为素数。在1640年 


写给梅森的一封信中，费马猜测2 2 ~ + 1总是素数，但他说他没有能力确定数 
4294%7297 = 2 32 + 1是否素数。费马和梅森都没有解决这个问题，尽管他们可以用 

下列方法做到这一 点：数 3 23 mod (2 32 + 1) 可以通过做32次模2 32 + 1平方运算来计 
算，且答案是3029026160;因此（根据费马自己的定理，他在同一年即1640年，发现 
了它！），数2 32 + 1不是素数。这个论证绝对没有提示我们哪些是因子，但它回答了 
费马的问题。 

对于证明一个给定数的非素性来说，费马定理是一个强有力的检验。当72不是 
素数时，总是有可能来求 x < n 的一个值，使得 mod 事实上，经验证明， 

这样一个值几乎总能非常快地求出。有某些稀少的 n 值，它们经常使得- 1 mod 

n 等于1，但在此情况下 n 有小于 K 的 因子； 见习题9。 

使用下面的思想可以推广这个方法来证明一个很大的素数72真是 素数: 如果有 
一个数 z ，对于它来说 X 的模7?阶等于 n - 1，则 n 是素数 （: c 的模72阶是使得 P mod 
n = l 的最小正整数见 3.2.1.2 小节。）因为这个条件意味着数： c 1 mod n ， 

x n ' 1 mod 77. 是不同的，且与 n 互素，所以它们必定是在某个顺序下的数1，2,…， 
^ -1; 于是 n 没有真因子。如果 w 是素数，那么这样一个数: r (称做 n 的一个原根) 
将总是 存在； 见习题3.2.1.2-16。事实上，原根相当多，它们有 -1) 个，而这是 

相当大的数，因为 n ! cp(n - 1) = OClog log?2 ) 0 

没有必要对所有小于或等于77 -1 的6来计算/ mod 72 ,以确定： r 的阶是否 
n - 1。工的阶为 72- 1的充要条件是： 

i )— 1 mod n ~\\ 

U ) 对于整除 n -1 的所有素数 P . X Kn ~ X)h ^ 77^1。 
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因为当且仪当、 V 是 X 的模72阶的倍数时^ mod n = lo 如果两个条件成立，而 

且如果々是: r 的模”阶，贝 U 我们由此知道 &是 7? - 1的一个因子，但对于 n ~ 1 的任 

^素因子户，不是 U _ l )/ f 的一个 因子； 惟一剩下的可能性是 A =：n -1。这就完成 
了证明 j 卩条件 i ) 和 ii ) 足以保证 n 的素性。 

习题10表明，对于每个素数 >，我们事实上可以使用不同的： r 值，且 n 将仍然 
是 素数； 我们可以把考虑限于 x 的素数值，因为由习题 3,2,1.2-15 dm 模? 2的阶整 
除 w 和 t ; 的阶的最小公倍数。使用在 4.6.3 节中所讨论的求数的乘幂的快速方法， 
可以有效地检验条件0和 ii )。 但是有必要知道 n -1 的素因子，所以我们有一个有 
趣的情况，在这个情况下，72的因子分解依赖于 72-1 的因子分解。 

一 个例子 对于相当典型的大数因子分解的研究有助于牢记我们已经讨论过 
的一些思想。我们来求一下2 214 + 1，一个65位数的素因子。如果我们注意到 

2 214 + 1 = (2 107 - 2 54 + 1 )(2 107 + 2 54 + 1) (15) 
则稍有一点洞察力就可开始这个因子 分解： 它是因子分解4/ + 1 = + + 

(2 z 2 -2 x + 1) 的一个特殊情况。1742年欧拉曾同 哥德巴 赫写信谈起它 [ P . H . 
Fuss,Correspondance Math , et Physique 1 (1843)，145]。 这个问题现在归结成为考 

察 （15) 中的每一个33位因子。 

一 个计算机程序很容易就发现2 107 - 2 54 十1 = 5 。857* %，其中 

72 0 = 37866809061660057264219253397 (16) 

是没有小于1000的素因子的29位数。 

使用算法 4.6.3 A 进行多精度计算表明 

3^° 1 mod ； 2 0 = 1 

所以我们怀疑〜是素数。通过试验十万亿左右可能的因子来证明〜是素数肯定 

是行不通的，但是上边讨论的方法给出了关于素性的一个能行的检验：我们的下一 
个目标是来分解72()-1。只经过一点点的困难，计算机就告诉我们 

n Q ~ I = 2-2-19-107-353- n !， n Y = 13191270754108226049301 

这里 ' 1 mod ^#1，所以〜非素数；继续进行算法 A 或算法 B ， 我们求得 

= 91813 • 7? 2 ，72 2 = 143675413657196977 

这次3 〜 —mod n 2 = l ， 所以我们将试图证明〜是素数。求出小于1000的因子产 
生出 n 2 _ 1 = 2 • 2 • 2 • 2 • 3 • 3 • 547 • n 3 , 其中 n 3 = 1824032775457。由于 

3" 3 ' 1 mod " 3 #1，我们知道〜是合数，而且算法 A 求出72 3 = 1103. 72 4 , 其中 72 4 = 

1653701519。数…表现得好像是一个素数（即 3^ _1 mod n 4 = l ), 所以我们计算 

rz 4 - 1 = 2 • 7 • 19 • 23 • 137 • 1973 

好； 这就是我们头一次完全的因子分解。我们现在可以返回去解释原先的一个子问 
题，即证明 q 是素数。使用习题10所建议的过程，我们计算下列 的值： 
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2 

2 

1 

2 

7 

766408626 

2 

19 

332952683 

2 

23 

1154237810 

2 

137 

373782186 

2 

1973 

490790919 

3 

2 

1 

5 

2 

1 


( 1 ) 

( 1 ) 

( 1 ) 

( 1 ) 

( 1 ) 

( 1 ) 

( 1 ) 

( 1 ) 


(17) 



2 


1653701518 


1 


(这里 “（1)” 表示无需计算的结果1，因为它可以从以前的计算推导出来。）于是《 

是素数，而且 n 2 ~ l 已完全分解。类似的计算表明？2 2 是素数，而且 n 0 - 1的这一完 
全因子分解最终证明，在另一个类似于 （17) 的计算之后^。是素数。 


(17) 的最后三行表示查找满足 x ( r ?4 ' 1)/2 ^ x ;? 4 _1 = l (modulo n 4 ) 的整数 x 。 如 
果〜是素数，我们只有50%的成功机会，所以情况 > = 2典型地是最难验证的一 
个。我们使用二次倒数法则（参考习题 23) 把这部分计算流水线化，它告诉我们，例 

如，每当 g 是一个同余于± l(moddo 5) 的素数时必有 5 (<7 — 1)/2 三 1 (modulo g )。 只 

要计算 mod 5就会明白 ，: r = 5大概不可能有助于证明 〜是 素数。但是事实上， 

习题26的结果意味着当检验”的素性时，=2的情况实际上全然不必加以考虑， 
除非 n -1 可以为^的一个高次幂所整除，所以我们可能要整个地删除 （17) 的最后 

三行。 


要分解的下一个量是 （15) 的另一半，即 


竹 5 



由于: T ^ 1 mod n 5 ^ l ， 我们知道〜不是素数，而且算法 B 表明 77 5 二 843589. n 6 ，其 

中 ”6 = 192343993140277293096491917。不幸的是，3%- 1 mo d 所以留给我 

们的是一个27位的非素数。继续执行算法 B 会把我们的耐心消耗完（不是我们的 
预算——因为我们正在使用的是周末的闲暇时间，而不是“主要时间”（这里主要一 
词即素数——译者））。但是算法 D 的筛方法将能把 n 6 分解成它的两个因子 


n 6 二8174912477117 。 23528569104401 

(结果是在6 432 966次迭代之后，算法 B 也成功了。）在一个相当长的时间里，算法 
A 不可能 发现、 的因子。 

现在计算完成了 ：2 214 十 1有素因子分解 

5 • 857 • 843589 • 8174912477117 - 23528569104401 - t 2 0 

其中是 （16) 中的29位素数。在这些计算当中包含一些好运气，因为如果我们不 
以已知的因子分解 （15) 幵始，十分可能的是，我们首先将找出小的因子，把 n 归结为 
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分解这55位数字更难得多了——算法 D 将是无用的，而且算法 B 使用的时 
间将太多，因为在这里高精度是必须的。 

在 John Brillhart 和 J . L . SeJiridge 的 一 论篇文 [Math , Comp . 21 (1967 ) ， 87 〜 

96)] 中，可以找到数十个进一步的数值例子。 

改进的素性检验 刚才说明的过程要求，在我们能证明 n 是素数之前，要对 
n -1 进行完全的因子分解，所以对于很大的〃，它将陷于困境。在习题15中描述了 
另一个技术，它代而使用对 n + 1的因子分解，如果 n -1 证明是太难了，则+ 1也 
许会容易些 。 

有一些重大改进可利用来处理很大的 77 。 例如，不难证明费马定理的一个更强 
的逆定理，它只要求^ -1 的部分因子分解。习题26表明，我们可以避免 （17) 中的 

大多数 计算； 三个条件 2^-* mod 724 = gcd (2( Y 0/23 - 1，” 4 ) = gcd (2 ( ^' 1)/1973 - l , 
?? 4 ) = 1足以证明心是素数 ， Brillhart 、 Lehmer 和 Selfridge 事实上已经建立/ 一 种 

方法，该法只需要数 n -1 和；2 + 1的部分分解 [ Math . Comp . 29 (1975) ，620〜 647) ， 
推论 11]: 假设 n - 1 = /— 厂—且” + 1 = /+ ，其中我们知道厂和广的完全因子 
分解，而且还知道，厂和 r + 的所有因子大于等于6。如果乘积 U 3 厂/+ • 
max (/ ，/+ )) 大于 2 n ，则只需少量额外计算（在他们的文章中有介绍）即可确定^ 
是否为素数。因此，只须通过找出 n ± l 的所有小于30030的素因子，通常在1 s 之 
内就可以检验多达35位数字的素性[见 J . L . Self ridge W M . C . Wunderlich , Congres - 
sus Numerantiuiriy 12 (1974 )，109 〜 120 ] 。像 n 2 ±72 + l 和 n 2 + 1 这样其它量的部 
分因子分解，可以进一步用来改进这个方法。[见 H . C . Williams 和 J . S . Judd , 
Math . Comp . 30 (1976), 157-172,867~886] 0 

实际上，当 ^ 没有小的素因子且 3 n_1 mod n = l 时，进一步的计算几乎总是表 

明72是素数（在作者的经验中，一个稀有的例外是 rz = y (2 28 - 9) = 2341-16381 )o 

另一方面， n 的某些非素数值对于我们已经讨论的素性检验来说肯定是坏消息，因 
为对于所有与^互素的 mod n = I 可能成立（见习题 9)。 一 个最小的这样 
的数是 n =3-11，17 = 561;这里，在等式3.2.1.2-(9)的记号下，义（；0 = 1011(2，10, 

16) = 80,所以每当： r 与561互素时: f 8 Q mod 561 = l = x 56 Q mod 561。 在偶然碰见它 
的因子以前，我们的过程将不断失败。为了改进这个方法，我们需要一个快速的方 
法来确定非素数 n 的非素性，甚至在这种病态情况下亦然。 

下面的令人吃惊的简单过程能以很高的概率来完成这一工作。 

算法 P (概率素性检验） 给定奇整数 I 本算法判定 n 是否素数。如同在下 
边的解释中所说明的，重复执行此算法若干次，在一个精确的意义下，有可能使^的 
素性极为可信，但是没有严格的证明。设 n = l + 2~， 其中 g 为奇数。 

P1. [生成 1] 设： T 是在 1< X < 72范围内的一个随机数。 

P2 .[乘幂化]置 j 二 0和 y ^ x q mod n (如同在以前的素性检验中一样，/ mod 
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n 应当在 0 (log 9) 步内计算出，参考 4.6.3 小节）。 

P 3 .[完成了？](现在 = X 2 、 mod ??。）如果 3 , = « - 1，或者如果 二 1 且；=0, 
则结束这个算法并说可能是素数”。如果 y = l 且^>0,则转向步骤 P 5。 
P 4. [ j •增值] j ■增加1。如果」< 々，则 置 ： y — y 2 niod n 并返回步骤 P 3。 

P 5 .[不是素数]结束算法，并说％肯定不是素数 ”。I 

构成算法 P 的思想是，如果/ mod n 关1和 77 - 1 + 2 k q 是素数，则值序列 

? 4 9^ 

x q mod n , x^ q mod n y x q mod n y … y 工一 q mod n 

将以 1 结束，而且在头一个 i 的前边的值将是〃 - 1(当 p 是素数时，对于/=1 
(modulo p )， 仅有的解是 ： yE 土 1，因为（: y - lKy + l ) 必须是 /) 的倍数）。 

习题22证明了对于所有77,算法 P 出错的可能顶多 是+这 一基本事实。实际 

上 ，对于大多数 n 它很少 失灵； 但关键之点是 ，不管 n 的值如何，失误的概率有界。 

假设我们重复调用算法 P ， 而且每当我们到达步骤 P 1 时，独立地和随机地选择 
: r 。 一 旦此算法报告 n 是非素数，我们就可以确信地说， n 肯定不是素数。但如果 
此算法在一行中25次报告说77可能是素数，则我们可以说72“几乎肯定是素数”。 
因为这样一个一行25次过程给出关于它的输人的错误信息的概率小于 （1/4) 25 。 这 
种机会小于10 15 分之一。即使我们以这样一个过程验证了 10亿个不同的素数，预 

料出错的个数仍将小于 1 QQ Q QQQ 0 因此如果真出了错，与其说算法 P 重复地猜测错， 

倒不如说由于硬件的失灵或宇宙射线的原因，我们的计算机在它的计算中丢了一 

位。 

这样的概率性算法使我们对传统的可靠性标准提出一个问 号：我 们是否真正需 
要有素性的严格证明。由于人们并不想放弃传统的证明思想 ， Gary L . Miller 已经证 

明（以稍弱的形式），如果数论中称做广义黎曼假设的某一著名猜测可被证明，则或 
者72是素数，或者存在一个 x <2 (ln n ) 2 使得算法 P 将发现 n 的非素性[见 
Comp . System ScL 13 (1976) ，300〜 317] 。在这个上界中的常数2是由 Eric Bach 给 
出的 ， Mai Cbmp . 55 (1990) ，355〜380。关于黎曼假设的各种推广的说明，请见 E . 

Bach 和 J . 0‘ Shallit 所著 Aigorif/imic Number Theory 1 (MIT Press , 1996) ，第 8 章。 

于是，相对于运行时间为 0 (log n ) 3 的概率性方法，我们将有在 0 (log n ) 5 个基本 
操作下检验素性的严格方法。但人们也可能问起，是否广义黎曼假设的任何所谓的 
证明有和对随机的1重复应用算法 P 同样的可靠性。 

关于素性的概率性检验首先是由 R . Solovay 和 V . Strassen 于1974年提出的， 
他们发现了习题 23 b ) 描述的有趣但更复杂的检验[见 SJCOMP 6 (1977),84 〜85; 7 
(1978),118]，算法 P 是 M . O . Rabin 给出的一个过程的简化版本，它部分是以 Gary 
L . Miller 的思想为基础的[参考由 J . F.Traub 编的 A/goWfhms and Complexity ( Aca ¬ 
demic Press , 1976), 35 ~ 36] 0 B . Arazi [ Comp ./. 37 (1994)，219 〜 222] 已经发现通 
过对于剩余的数使用 Montgomery 的快速方法，对于很大的 n 可使算法 P 大大加速 
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(习题4.3.1-41)。 

素性检验的一个完全不同的方法是1980年由 Leonard M . Adlemari 发现的。他 
的极为有趣的方法是以代数整数论为基础的，所以它超出了本书的 范围； 但它导致 
了一个非概率的过程，此过程将在至多几个小时内，判定多达比如说250位数字的 

任何数的素性。[—般来说 ，运行 时间是 （ log n ) G(bg l ° g bg ” >; 请见 L . M . Adleman , C . 
Pomerance 以及 R . S . Rumely , Anna/s of Math • 117 (1983 )，173 〜 206。 ] 但 H . W . 

Lenstra ， Jr . 所做修改在实践中是更快的，它已由 H.Coheri 和 A . K . Lenstra 所实现的 

[ Math . Comp . 42 (1984) ，297〜330; 48 (1987) ，103〜121 ] 。 

Adleman 和黄铭德 （ Ming-Deh A , Huang ) 后来发现一个过程，它对于所有素数 n 

寻找素性的严格证明，而且以很高的概率具有 log ^的多项式的运行时间 [ Lecn^ e 
Notes in Math . 1512 (1992)]。 然而，他们的方法似乎只有纯粹的理论价值。 

通过连分数分解因子至今我们已经讨论的分解因子过程通常在30位数或更 
多位数时就受挫了。因而，如果要前进一步就需要新的思想。幸而确有这样的思 
想； 事实上，有分别由 A . M . : Legendre 和 ML Kraitchik 给出的两种思想 ，它们 导致许 
多年前 D . H . Lehmer 和 R . E . Powers 发明出一种新技术 [ Bull . Amer . Math . Soc . 37 

(1931) ， 770 〜 776]。 但是，这个方法在当时未被使用，因为它不大适合于台式计算 
器。这种否定的判断一直流行到20世纪60年代末，那时 John Brilihart 发现 
Lehmer - Powers 的方法值得重新引起注意，因为它非常适合于计算机程序设计。事 
实上，后来他和 Michael A , Morrison 把它发展成为在70年代有名的所有多精度因 
子分解方法的翘楚。他们的程序在一台 IBM 360/91计算机上大约30 s 之内处理典 
型的25位数字，在约50 min 之内处理40位数字[见 Math . Comp . 29 (1975) ，183〜 

205]。1970年这个方法获得了它的头一次辉煌的成功，发现2 128 + 1 = 
59649589127497217，5704689200685129054721。 

其基本思想是寻找数： r 和^使得 

= : y 2 ( mod\ilo N ) , 0< x <. N ^ x ^ y.x + y^N (18) 

费马的方法提出了较强的要求 jc 2 - y 2 二 N 。 但实际上同余式 （18) 足以把/ V 分成因 
子：它意味着 N 是:^-^ 2 = (：^-3；)(工+ 30的因子，但」 > ^既不整除:?：-)也不整除 
z 因此 gcd ( N , j ： _ y ) 和 gcd ( N , x + )，)是 N 的真因子，它们能用4。5,2小节中 
的有效方法找到。 

发现 （18) 的解的一个方法是对于小的值卜寻找： r 的值使得: r 2 三 a (modulo 

N ) 0 我们将会看到，把这个同余式的一些解归拢在一起来得到 （18) 的解通常是一 
件简单的事。现在对于某个是和 J 5以及小的 I I ，如果= a + kNd 2 ，则分式 d 

是对于的一个好的 近似； 反之，如果： r / d 是的一个特别好的近似，则差 

I x 2 - kNd 2 I 将很小。这个发现提示我们寻找的连分数展开，因为我们在等式 
4.5.3-(12)和习题 4.5.3-42 中已经看到，连分数产生好的有理近似。 

在习题 4.5.3-12 中证明了二次无理式的连分数的许多使人高兴的性质。以下 
的算法利用这些性质导出对同余式 
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x z = ( — l ) e ^ p\ l p e ^- mmm p 6 ^ 1 (modulo N ) (J9) 

的解。这里我们使用小素数仏= 2,/) 2 = 3,…，直到 K 的固定 集合； 在这个表中应 

出现的 f 都满足 f 二2或 UN) ( 〃 1)/2 mod 户<1，因为其它的素数绝不会是由此算法 
生成的数的因子（见习题 14) 。如果 （ ，…， ) ，…， （ uo, ，6^，…，^ ) 

是 （19) 的解，它们使得向量和 

(4i ， &L ， … ， 6ml) + …+ ( e 0r ^ e \r » *** » e mr) = ,2e \ ，■- - ,2e m ) (20) 

的每个分量都是偶数，则除了可能有外， 

， ， / 

x = (Xj *** ^: r ) mod N , y = ((- lY Q p \ 1 * * * p e ^ ) mod N (21) 

产生 （18) 的一个解。条件 (20) 实质上指出这些向量模 2 线性相关，所以如果已经找 
到 （19) 的至少 m +2个解，则我们必定有 （20) 的一个解。 

算法 E (通过连分数进行因子分解）给定一个正整数 W 和正整数々，使得 WV 

不是一个完全平方，本算法通过分析_的连分数的收敛式，试图发现对于固定的 
m， 同余式 （19) 的解。（另一个算法使用这些输出来发现 iV 的因子，这是习题12的 
主题。） 

E 1. [初始化]置 D —— Lv^」，ir— 2只，17—[/，—尺/，\/—1，\^—1)- 

R 2 , P-^R , P^l , A ^0, S—0 o (此算法遵循习题 4.5.3-12 的一般过程， 

寻找的连分数展开。变量 U f U \ V , V \ P y P \ A 和 S 分别表示该 

习题称为只 + U n , R ^ U n . v , V ;? , V n -^ p n mod N y p t} _ x mod N， 及 

n mod 2 的那些量。我们将总有 0< V< L/<iT , 所以仅仅 P 和 K 需要最 

高精度。） 

E 2. [推进 L 7, V ， S ] 置 T — V， V — A ( lT — U) + T , AU/ V J , 

IT—U，U—R' _(U mod V ), S ^ l-So 
E 3. [分解 V ] (由习题 4.5.3-12 c ) 对于与 P 互素的某个 Q , 我们有 

P 2 -々 NQ 2 = ( - l ) s v 。） 置 U G ， q ， …，〜 ）—（ S \0, …， 0)， T — V 。现在对 

j^：m 做下列工作：如果了 mod 二0，则置了―77岛；且^ ^ + 1，并 

重复这个过程直到了 mod p] 判 为止。 

E 4 -[得到解了？]如果丁 = 1，则输出值（^，，^，…，^广它组成^^的一个 

解。（如果已经生成足够的解，则我们现在可以结束这个算法。） 

E 5. [推进 P f Pl 如果 V 关1，则置 T — P，P — (AP + P y ) mod iV ，？/ — 丁，并 

返回步骤 E 2。 否则连分数过程已开始重复它的循环，也许对 S 除外，所以 
算法结束。（循环通常很长，以致这种情况不会发生 。）I 
考虑一个例子 ： N = 197209, ^ = 1， m = 3 7 = 2 f p 2 = 3, p 3 = 5 ,我们可以说明 

算法 E 对相对小的数的应用。这个计算过程如表1所示。 
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表1 算法 E 的一个示例 



197209 yk = 1 ,m = 二 2 ， /> 2 二 3，/> 3 = 5 


E 1 之后 
E 4 之后 
E 4 之后 
E 4 之后 
E 4 之后 
E 4 之后 
E 4 之后 
E 4 之后 
E 4 之后 
E 4 之后 
E 4 之后 
E 4 之后 
E 4 之后 


U 

888 

876 
882 
857 
751 
852 
681 
863 
883 
821 

877 
875 
490 


V 

1 

73 

145 

37 

720 

143 

215 

656 

33 

136 

405 

24 

477 


0 

12 

6 

23 


26 


36 

1 


P S 
444 0 

444 1 

5329 0 

32418 1 

159316 0 

191734 1 

131941 0 

193139 1 

127871 0 

165232 1 

133218 0 

37250 1 

93755 0 


T 输出 

73 

29 

37 

1 159316 2 = + 2 4 ‘ 3 2 , 5 ! 

143 

43 

41 

11 

17 

1 133218 2 = + 2 °- 3 4 - 5 1 

1 37250 2 =- 2 3 - 3 ! - 5 0 

53 



继续计算，在头100次迭代中给出25个 输出； 换句话说，这个算法正在十分迅 
速地求解。但是某些解是平凡的，例如，如果上述的计算再多继续14次，我们将得 
到输出 197197 2 三2 4 .3 2 .5 0 ,它不值得注意，因为197197三-12。上边的头两个解已 
足以完成这个因子分解：我们已经求得 

(159316 • 133218) 2 三 (2 2 • 3 3 • 5 1 ) 2 (modulo 197209) 

于是 （18) 对于 I = (159316-133218) mod 197209 = 126308， 3 ； = 540成立。由欧几里 
得算法， gcd ( 126308 - 540， 197209) = 199;因此我们得到很好的因子分解 

197209 = 199 • 991 

按照 R.Schroeppel 于 1975 年告诉作者的未发表的思路，对算法 E 的运行时间 
作一启发式的分析，可以理解该算法为什么能如此成功地分解大的数。为方便起 
见，我们假定々 = 1 ，为产生 N 的因子分解所需的输出数大约同正被分解出的小素 
数的个数 m 成正比。步骤 E3 的每次执行花费的时间的阶大约为 w log iV 个时间 
单位，所以总共的运行时间大约同 m 2 log 成比例，其中 P 是每次迭代有一成功 


输出的概率。如果我们做保守的假设，即 V 随机地分布于 0 和 2 #之间，则概率 

P 是 (2 乘以小于 2 #的整数个数，而这些整数的素因子全都在集合丨仏， 

…， AJ 中。习题29给出 P 的一个下限，由之我们可得出结论 ：运行 时间的阶至多 
为 



m 






(22) 


如果命 In 爪近似于 y \/ln N in In N ，则我们有 r ^ ^ln N / In In N - 1 ，假定 

二 OUlog m )， 则公式 ( 22 ) 归结为 


# 


362 



exp (2 \/ (In N ) (In In N ) 十 0( (log N)^ 2 (\og log N)—" 2 (log log log N))) 

换句话说，在相当可信的假定下，预期算法的运行时间至多为 」 V ( A0 , 其中当 N — 

⑴ 时指数 4N) 〜 2 Vln In N / In iV 趋向 0 。 

当 JV 是在实用范围中时，我们当然不能对这种渐近估计太过认真。例如，如果 
N =10 5 Q ，当 a 〜 4. 75时我们有 N 1/c = (lg A 0 a ， 而且当 N = 10 ■时 ，对于 a 〜 8. 42 

同样的关系成立。函数# (:%0 的增长阶大约在 N 1/a *(lg N ) a 之间； 但除非 iV 大得 
出奇，所有这三种形式差不多是相同的。 M . C . Wunderlich 所做的大量计算实验表 
明，算法 E 的 一 个改进型的执行要比我们估计 的执行 好得多[参考 Lecture Notes in 


Math, 751 (1979),328 〜 342]; 尽管当 N = 10 5 ◦时2 7 In In N / In iV 〜 .41， 当分解 
10 13 < N <10 42 范围内的几千个数时，他花费的运行时间约为 N 015 o 

算法 E 实质上是通过以 6 iV 代替 iV 来开始它的分解的努力的，这种方法有一点 
怪（如果不是彻底的愚蠢）。“请原谅，你是否介意，我在尝试对你的数进行因子分解 
之前，先用3乘它。”尽管这样，它确是好的想法，因为 A 的某些值将使诸数 V 可能 
为更多的小数所整除，因此它们将更有可能在步骤 E 3 中被完全 分解； 另一方面，々 
的一个大值将使 V 个数更大，因此它们将较不可能完全分解。我们要通过明智地 
选择 々来平 衡这些趋势。例如考虑 V 被5的乘幂整除的可能性。在步骤 E 3 中，我 

们有 p 2 -6 NQ 2 = (-1) S V ，所以如果5整除 V ，我们有 P 2 三; WQ 2 ( moduk ) 5)。在 
这个同余式中， Q 不能是5的一个倍数，因为它与 P 互素，所以我们可以写 （ P / Q) 2 

(modulo 5)。如果假定 P 和 Q 是随机的互素整数，使得24种可能的数偶 
mod 5 , Q mod 5 ) 尹 （ 0，0 ) 是同样可能的，贝 I 」依赖于 AN mod 5是0,1，2,3或4,5整 


除 V 的概率是 



24,24 


，0,0或 



24 


类似地，除非 kN 是25 的倍数，25整除 V 的概率分 


别是 0, 600 ,0,0, 600° 


一般来说，给定使 UiV) (/)_1)/2 mod f = 1的奇素数/>，我们求得 


V 为/的倍数的概率是 "（/MQ + l )); 而且夕整除 V 的平均次数是 2pl(p 2 - 
1 )。由 R . Schroeppel 提议的这个分析提 示，々 的最好选择是使 

Y]f(pj^kN)log p } - ylog k (23) 

取极大值，其中/是在习题 ; 28中定义的函数，因为这实质上是当我们达到步骤 E 4 
时 ln (/ W / T ) 的期望值。 

当々和 m 都已选择好时，用算法 E 将得到最好的结果。 m 的适当选择只能通 
过实验检验做到，因为我们所做的渐近分析太粗糙了，尚不足以给出充分精确的信 
息，而且对于这个算法的各种各样的改进可能会产生预料不到的效果。例如，通过 
比较步骤 E 3 同算法 A 我们可以作出一个重要的改 进：每 当我们发现丁 mod Pj ^0 

和 LT / 岛」<岛时， V 的因子分解即可停止，因为： T 将成为1或素数。如果 丁是大 
fp m 的素数（在此情况下它最多是+九,_ 1)，我们仍然可以输出 （ P ，^， …， 
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~，了），因为已经得到一个完全的因子分解。算法的第二阶段只使用诸素数 T 至 

少已经出现两次的那些输岀。这一修改的效果是产生更长的素数表，而不增加因子 
分解的时间。 Wunderlich 的实验指出，当 N 处于 10 4G 附近时 ， 利用这一改进， m 〜 

150就工作得很好。 

因为步骤 E3 是这个算法中最消耗时间的部分， Morrison ， BrUlhart 及 Schroeppel 

已经提出了好几种方法，以便在成功希望不大时中断这个步骤： U ) 每当了变为单 
精度值时，仅当 LT7 巧」〉 p ， 及 3 r_1 mod T ^ l 时，才继续进行。 （ b ) 在找出 小于& 

p m 的因子之后，如果： T 仍然大于 fi ， 则放弃之。 （ c ) 对于比如说100批左右连续的 
V ，仅仅找出直到，比如说/> 5 的因子，以后才继续因子分解，但只对每批中已经产生 
最小剩余的了的那些 V 进行。（在找出直到仏的因子之前，计算 V mod 

乂 4 鈐是明智的，其中诸/足够小使得 KWaK 5 能用单精度处理， 
但又要足够大，使得不可能出现 v mod y / + 1 -0 o 因此单精度剩余是 v 模五个小 

I 

素数的值的特征。 

关于算法 E 的输出中循环长度的估计，见 H . C . Williams , Matii . Comp . 36 
(1981)，593〜601。 

*一 个理论的上限 从计算复杂性的观点看，我们希望知道是否有任何因子分 

解的方法，它的预期运行时间可以证明是 0(/ V (( N ) ) ，其中当 iV — oo 时 〆 （ N ) — 0。 

我们已经看到算法 E 大概有这样一种特性，但是，似乎没有希望找到一个严格的证 

明，因为连分数不是充分地有规律的。在这种意义下，存在一个好的因子分解算法 
的头一个证明是由 John Dixon 于1978年发 现的； 事实上， Dixon 证明，考虑算法 E 

的一个简化形式就足够了。在算法 E 的简化形式中去掉了连分数的工具，但保留了 

(18) 的基本思想。 

Dixon 的方法 [ Math . Comp . 36 (1981) ，255〜 260] 简单地说是，假设已知 N 至 
少有两个不同的素因子，而旦 N 不为头 m 个素 数川， p 2 ，…，所整 除：在 0 < X < 

N 范围内选择一个随机整数 X ，并令 V = X 2 mod N 。 如果 V = 则数 gcd ( X , N ) 
是 JV 的一个适当因子。否则，和在步骤 E 3 中一样，找出 V 的所有小的素 因子； 换 

句话说，把 V 表达成形式 

V = p e ? … p e jT (24) 

其中 丁不为头 m 个素数的任何一个所整除。如果了 =1，则这个算法如同在步骤 
E 4 中那样进行，输出 （ X ， q ，…， 〜），它表示 （19) 的一个解且 e 0 = 0 o 这个过程以 X 

的新随机值继续下去，直到有充分多输出使我们能通过习题12的方法发现 N 的一 
个因子。 

为了分析这个算法，我们要找出下列概率的界 ： U ) —个随机的 X 产生一个输 
出的 概率； （ b ) 在找出一个因子之前要求的大量输出的概率。设 P ( m ，/ V ) 是 （ a ) 的 
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概率，即当 X 随机地选 择时了 =1的概率。在试验了 X 的 M 个值之后，平均说来， 

我们将得到 MP ( 772 , N ) 个 输出； 而且输出的数目有一个二项式分布，所以标准差小 

于均值的平方根。概率 （ b ) 相当容易处理，因为习题13证明，这个算法需要多于 w 
+々个输出的概率小于2^。 

习题30证明，当 r = 2 Llog NK 2 log AJ 」 时 ， r ! iV ) ，所以如同 

在 (22) 中做过的那样，我们可以估计运行时间，但用 N 代替量 2^ J /。 这一次我们 
选择 


r 二 V 2 in N I In lr \ N + 6 

其中 Ml <1且 r 是偶数，因此我们选择 m 使得 

r = In N / In p m + 0( l/iog log N ) 

这意味着 

! , / in N In In N 6 ' , w 〜 “ 

^Pm =y - 2 - — y ln In N + 0(1) 

ln m =ln = In p m - In In p m + 0( l/log p m )= 

/ In Nln In N 汐 + 1 ， t t , XT 、 

y 2 " ^ 2 ^ n h N + 0( log log log N ) 

r 

r 、 n ~ ex p ( — \/2 In N In In N + 0( r log log logN )) 

我们将选 __ M 使得 iV )>4 州； 因此预期的输出个数 MP ( m , N ) 至 

少将是 4 m 。 算法运行时间的阶是 Mw log iV , 加上对于习题12的 0( m 3 ) 步； 结果 
表明 ， O ( m 3 ) 小于 Mm log N . 

ex p (V 8 (In N )( In In N ) + 0(( log N)" 2 (log log iV) _ " 2 (log log log N ))) 

这个方法找不到一个因子的概率小得可以忽略不计，因为得到少于 2 m 个输出的概 

率至多是 e _ w /2 ( 见习题31)，而由头个输出 （ m 》 lnN ) 中找不到因子的概率至 
多是 2_ w 。 我们已经证明了下面 DLxon 原来定理的稍微增强的形式。 

定理 D 有一个算法，其运行时间是 0 ( N KM )， 其中 e ( N ) = c Vln In N / In N 

且 c 是任何大于我的常数，每当 N 至多有两个不同的素因子时，这个算法以 1- 0(11 
N ) 的概率找出 JV 的一个非平凡的因子。 i 

其它方法 John M . Pollard 还曾提出了另一个因子分解的技术 [ Proc . 
Cambridge Phil . Soc . 76 ( 1974 ), 521 〜 528]，当 p - 1 没有大的素因子时，他给出了一 

个实用的方法来发现 N 的素因子在算法 A 和 B 已经在一个很大的 iV 运行太久 
时，后一个算法（见习题 19) 大概应是尝试的头一件事。 

由 R . K . Guy 和 J . H . Conway 与的综述论文， Congressus Numerantium 16 

(1976),49 〜89,给出了直到那时为止关于这方面的发展前景。 Guy 指 出：“ 在本世 

纪里，如果不采用特殊形式，某个人能够正规地分解大小为 10 8 G 的数，那我会甚感惊 
讶。”在此后20年间他确实要大感惊讶许多次了。 

从 Carl Pomerance 1981 年的二次筛方法[参见 Lecture Notes in Comp . Sci . 209 
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(1985)，169〜 182] 开始，在20世纪80年代期间对于大数的因子分解取得了巨大的 

发展。后来 ， Hendrick Lenstra 设计了 椭圆曲线方法 [Ams/s of Math . 126 (1987)， 

649〜 673] ，它预期花费约 0 (ln p)(\n In p )) 个乘法来求出一个素因子 


P 


o 


这近似于当 P 



#时我们对算法 E 估计的运行时间的平方根，而且当/ V 有相 


对地小的素因子时，它甚至变得更好些。关于这个方法的一个精彩解释已由 Joseph 

H . Silverman 和 John Tate 给出 ， Rational Points on Elliptic Curves (New York ： 

Springer , 1992) ，第 4 章。 


John Pollard 于 1988 年又以另一个新技术回到这个领域，它的这个技术已被称 
做数域筛，有关这个方法的一'系列的论文，请见 Lecfure Notes in Math . 1554 (1993) ， 
它是当前分解极大整数的最佳方法。当 oo 时预期它的运行时间的阶是 

exp ( (64/9 + ^ ) 1/3 (In N) 1/3 (in In N ) 2/3 ) (25) 

按照 A . K.Lenstra 的说法，数域筛的调节好了的版本开始超过二次筛的调节好的版 
本的转折点出现于 N ^10 ll2 n 


关于这些新方法的细节超出本书的范围，但是通过注意到对于形如2 2 ' + 1形式 

的未被分解的费马数被攻克的某些早期成功的故事，我们对于它们的有效性可以获 

得一些 概念。 比如，在大约花掉了 700个工作站的空闲时间进行4个月的计算之 
后，用数域筛求出了因子分解 

2 512 + 1 = 2424833 • 


7455602825647884208337395736200454918783366342657 - p 99 

[ Lenstra ， Lenstra，Manasse 和 Pollard , MatA . Comp. 61(1993) ， 319 〜 349; 64 (1995) ， 
1357]; 这里 八 9 表示一个 99 位的素数。下一个费马数有两倍于此的数字，但在 

1995年10月20日它屈服于椭圆曲线 方法： 

2 1024 + 1 = 45592577 - 6487031809 . 

4659775785220018543264560743076778192897 - p 252 

[Richard Brent , Math . Comp. 68 (1999)，429 〜 451 。 ] 事实上，早在 1988年， Brent 已 
经碰巧使用椭圆曲线方法解决了下一个 情况： 

2 2048 + 1 = 319489 - 974849 - 

167988556341760475137 - 3560841906445833920513 - p 564 

除了一个之外所有素因子都小于10 22 ,因此椭圆曲线方法是赢家。 

那2 4()% + 1如何呢？现时，这个数似乎还完全无法达到。它有5个小于10 16 的 

因子，但未被分解的余数有1187位十进数字。下一个情况2 8192 + 1有小于10 27 的4 

个已知的因子 [ Crandall 和 Fagin ， Math, Comp. 62 ( 1994 ) ， 321 ; Brent Crandall ， Dilch - 
er 和 van Halewyn ， 待发表]以及一个巨大的未被分解的余数。 


秘 密因子 当 R ■ L . Rivest , A . Shamir 以及 L . Adleman 发现了对信息进行编码 
的一个方法时，全球范围内对于因子分解问题的兴趣骤增。该方法可以只须知道一 
个很大的数 」 Y 的因子就可明显地译码，即使编码方法人人皆知。由于有相当数量 
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的世界最伟大的数学家都未能找到因子分解的有效方法，因此这个方案 [CACM 21 
(1978)，120〜 126] 几乎肯定提供了在计算机网络中保护机密数据及进行通信的安 
全方法。 

让我们想像称做 RSA 箱的一个小的电子设备，它的内存中有两个大的素数户 
和9。我们将假定 f -1 和 g -1 不为3所整除。 RSA 箱以某种方式同一台计算机 
相连，而且它已告知计算机乘积 N =/^ ; 然而，除非通过对 N 进行因子分解，没有人 
能发现和(？的值，因为 RSA 箱的设计很特殊。一旦有人企图撬开它，它就自动毁 
掉。换句话说，如果它被冲撞，或者如果它受到任何辐射（这辐射有可能改变或读出 
存在里边的数据），它就将抹去它的内存。而且 RSA 箱是充分可靠的，因而它绝不 
需要 维护； 如果出现一个紧急情况，或者如果它破旧了，我们把它扔掉再买一个即 
可。素因子^和 g 是由 RSA 箱根据本质上像宇宙射线这样的真正随机的现象的某 
个方案自动生成的。重要之点在于没有人知道 f 和心甚至没有人或组织拥有或有 
办法访问这个 RSA 箱； 没有办法贿赂或敲诈任何人或扣压任何人质以便发现 N 的 
因子。 

为了传送一个秘密信息给 RSA 箱的主人，如果这个箱的乘积为 iV ， 那么你要把 
信息分成数 （^ i ，，…， a ) 的序列，其中每个 X ,是在0和 N 之间，然后传送数 

( x \ mod / V ，…, x \ mod N ) 

如果知道和 g ， RSA 箱可以破译信息，因为它先计算一个数 d < iV ， 使得 
(modulo ( p - l ) U _ l )) ; 利用 4.6.3 小节的方法，它现在能在合理的时间内计算 
(^ 3 )^ mod N = x 。 自然， RSA 箱的这个魔数 d 只有它自己 知道； 事实上， RSA 箱可 
以仅仅记住 d 而不是 p 和 c /， 因为在计算了 N 之后，它惟一的责任是保护它的秘密， 
并取立方根模 N 。 

如果 x <%， 则上述的编码方案是低效的，因为： r 3 mod N 二: c 3 , 而且立方根 
容易找到。 4.2.4 小节中前导数字的对数定律意味着 A 位信息的前导 

位 A 将有1/3的机会小于所以这是一个要加以解决的问题。习题32给出了 
一^个解决办法。 

RSA 编码方案的安全性依赖于 ：如果 不知道 N 的因子，则没有人能发现怎样来 
取立方根模 N 。 也许这样的方法找不到，但是我们不能绝对肯定。至今能明确的 
是，所有通常发现立方根的方法都将失灵。例如，实质上，没有办法尝试把数 d 作为 
N 的一个函数来 计算； 原因是，如果 d 已知或者事实上如果已知适当大小的任何数 

m ， 使得对于足够数量的 x ， x w Tnod N = 1 成立，则我们可以在另外一些步之内找到 
N 的因子（见习题34)。于是，明显地或含蓄地以寻找这样一个 m 为基础的任何解 
法都不能比分解因子更好。 

然而，某些预防措施是必要的，如果把同一个消息发送给在一个计算机网络上 
的三个不同的人处，则通过中国剩余定理某个知道： u 3 模1^為和 N 3 的人可以重 

新构造 x 3 mod /^屮 2 乂 = ^ 3 ，所以 2 将不再是一个秘密了。事实上，即使把一个带 
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有“时间标签”的消息 （2 ng + G ) 3 mod / V , 发送给 7 个不同的人，通过已知或可猜 
测的也可推导出： r 的值来（见习题44)。因此某些密码专家建议用2 16 + 1 = 

65537作为指数而不是用3来进行 编码； 这个指数是素数，而且 x 65537 mod N 的计 
算时间是: r 3 mod N 的计算时间的 8.5 倍。 [CCITT Recommendations Blue Book , 
( Geneva : International Telecommunication Union , 1989), Fascicle VIII . 8 , Recommen ¬ 
dation X . 509 ， AnnexC ，74 〜76。 ] Rivest，Shamir 和 Adleman 原来的建议是用 ： mod 

N 来对: r 进行编码，其中 a 是和 p ( iV ) 互素的任何指数，而不就是 3; 然而，实际上， 
我们喜欢的是编码比译码更快的指数。 

为使 RSA 方案能行，数 p 和^不应当仅仅是“随机”素数。我们已经提及， p-l 
和 g -1 不应为3所整除，因为要确保模 N 惟一立方根存在。另一个条件是， p -1 
应当有至少一个非常大的素因子， 9-1 也应 如此； 否则 iV 就可以使用习题19的算 
法来进行因子分解。事实上，该算法实质上依赖于寻找具有下列性质的相当小的数 

对于它 mod N 经常等于1，而且我们刚刚见到，这样一个 m 是危险的。当 f 
_1 和有很大的素因子仏和 A 时，习题34中的理论意味着 ， 777 或者是 化 h 

的一个倍繫（因此77?将很难被发现）或者是 x m = 1小于 1/ p ] q { 的概率（因此 

/"mod N 几乎永不为1)。除了这个条件之外，我们不希望 p 和 g 彼此很接近，以 

免算法 D 能发现 它们： 事实上，我们不要比例 p / g 接近于一个简单的分数，否则算 
法 C 的 Lehman 推广就能发现它们。 

生成 f 和的下列过程几乎肯定是不可破的 ：由比 如说在10 80 和10 81 之间的一 


个真正的随机数 p Q 开始，寻找大于如的头一个素数乂；这将要求检验大约如 

〜90个奇数，而在做了算法 P 的50次尝试之后，以大于 1-2— 1QG 的概率来使仏成 

为一个“可能的素数”将是充分的。然后，在比如说10 39 和 10 4G 之间选择另一个真正 
随机的数02,寻找形如 々 Pi + 1的头 一^ 个素数/>，其中 p 1 ， k 是偶数 >而且 pi 


(modulo 3)。在找到一个素数 p 之前，这将要求检验大约 + p [ p 产 个数。 


这 


个素数 f 将有大约120位数字那么长，可以使用一个类似的构造来找出大约130位 
数长的素数 g 。 为增加安全性，可能还值得建议，应检查确认 p + ： [和 g + 1 都不完 
全由相当小的因子组成（请见习题20)。其数量级将是大约 10 25 G 的乘积" = /)(?，现 
在满足我们所有的要求。现时这样一个 iV 可以被分解因子是不可想像的。 

例如，假设我们知道有 一 个方法可以在 N 01 ms 之内分解一个250位数字的数 
iV ， 这相当于10 25 ms 5 而一年中仅有31 556 952 000⑻0 ms , 所以我们将需要多于 
3 X 10 11 年的中央处理器时间来完成这个因子分解。即使一个政府部门购买100亿 
台计算机而且把它们全都用来解决这个问题，在它们当中的一台可以把 A / 分解成 
因子之前，那也将花费31年时间。况且政府购买这么多专门的机器总会走漏风声， 
那样人们将开始使用300位数字的 N 。 
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由于人人都知道 ：r ^ jc 3 mod N 的编码方法，因此这个码除仅可由 RSA 箱分解 
开之外，还有另外的优点。这样的“公钥”系统首先是由 W.Diffie 和 M.E. Heilman 

在 IEEE 丁窗 s . n'22 (1976),644 〜 654 上发表的。下面举例说明当编码方法是公 

幵的时可以做什么。假设 Alice 要用电子邮件同 Bob 通信，而且假设他们俩都想要 
信件是签了名的，使得接收者都能确信没有其他人伪造任何消息。是传 

送给 Alice 的消息 M 的编码函数，设 D A ( M ) 是由 Alice 的 RSA 箱完成的译码，并设 

£^( AO ， Ab ( M ) 是 Bob 的 RSA 箱的相应的编码和译码函数，则 AUce 可以发送一个 

签了名的消息，办法是先签上她自己的名字和对某些机密的消息填上日期。然后用 
她的机器计算 D s ( AO , 并把 E S ( D A ( M )) 传送给 Bob 。 当 Bob 得到这个消息后，他 

的 RSA 箱把它转换成 D A ( M )， 而且他知道，所以他能计算 M = E a ( D a ( M )) 0 

这将使他相信，消息确实来自 Alice ; 其他人不可能发送消息 D a ( M )。 （好， Bob 本人 

现在知道 i ^( M ) ，所以他可以通过把 E X ( D A ( M )) 传送给 Xavier 来假冒 Alice , 为 

了挫败任何这样有意的假冒， M 的内容应明确地指出它仅仅供 Bob 观阅。） 

我们可能要问， Alice 和 Bob 怎么知道彼此的编码函数和呢？这是不能 

简单地存在一个公开的文件中的，因为 Charlie 可能破译这个文件，用他自己计算过 
的另一个 N 代 替它； 然后 Charlie 可能在 Alice 和 Bob 发现丢失了什么之前就偷偷摸 
摸地截获住秘密的消息并予译码。解决方法是在一个特殊的公开目录中保持乘积 
数这个目录中有它自己的 RSA 箱和它自己广泛公开化的乘积数 ] V D 。 

当 AHce 要知道如何同 Bob 通信时，她向目录问 Bob 的乘 积数； 目录计算机向她传送 
一个签署了的消息，该消息给出 ] V B 的值。没有人能伪造这样一个消息，所以它必 
定是真实的。 

Michael Rabin 已经提出了 RSA 箱方案的有趣的替代办法 [ MIT Lab. for Comp. 
Sci. ,Report TR-212 (1979) ]， 他提出用函数: c 2 mod A/ 而不是: r 3 mod N 迸行编码。在 

这种情况下的编码机制可以称为一个 SQRT 箱，它送回 4 个不同的 消息； 原因是 4 个 
不同的数有相 N 的平方模 A/ ， 即： c ， ~~ x ,fx mod N 及(~ fx ) mod N ， 其中 

f 二 ( p q ~ l - q p ~ l ) mod /V 。 

如果我们预先约定： r 是偶数，或者则二义性落到两个消息当中，而假定两 

个当中仅有一个有意义。如同在习题35中所示，二义性事实上可以完全消除。 Ra ¬ 
bin 的方案有重要 的性质 ，它可以证明下列结论 ：求平方根模 ]V 和因子分解#=抑 
一样难，因为当： r 随机地选择时通过取 P mod N 的平方根，我们有1/2的概率找到 

一个^值，使得 

X 2 = y 2 , S x 汐 

然后 gcd(x _ y ，' N 、 二 p 或 g 。 然而，这个系统有一个致命的缺点，而它在 RSA 方案 
中似乎不出现(见习题 33) :任何访问 SQRT 箱的人都能容易地确定它的. V 的因子。 
这不仅使不忠实的雇员可以作弊或进行敲诈，它也允许人们发现他们的 p 和 I 在 
这之后他们可能断言，他们在某个传送的文件上的“签字”是伪造的。显然，秘密通 
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信的目 标导致了微妙的问题，它十分不同于我们在算法设计和分析中通常所面临的 
那些向题。 

已知的最大素数 在本书的其它地方，我们已经讨论了若干计算方法，它们都 
要求使用很大的素数，而刚刚介绍的一些技术可比较容易地用来发现比如说多达 
25位或小一点的素数。表2示出了小于典型计算机字大小的10个最大素数（一些 
其它有用的素数见习题 3.2.1.2-22 和 4.6.4-57 的答案）。 


表2 有用的素数表 


N 


“2 

“3 

^4 

a 5 

^6 

ai 

一 ♦•- 

^8 

^9 

1 

a iQ 

2 15 

19 

49 1 

51 

55 

61 

75 

81 

115 

121 ； 

135 


]5 

17 

39 

57 

87 

89 

99 

113 

117 

123 

2 n 

1 

9 

13 

31 

49 

61 

63 

85 

91 

99 


5 

11 

17 

23 

33 

35 

41 

65 

75 

93 

2 19 

J 

19 

27 

31 

45 

57 

67 

69 

85 

87 

2 20 

3 

5 

17 

27 

59 

69 

129 

143 

153 

185 


■■ 

19 

21 

55 

61 

69 

105 

111 

121 

129 

2 22 ' 

3 

17 

27 

33 

57 

87 

105 

113 

117 

123 

2 23 

15 

21 

27 

37 

61 

69 

135 

147 

157 

159 

2 24 

3 

17 

33 

63 

75 

77 

89 

95 

117 

167 

2 25 

39 

49 

61 

85 1 

91 

115 

141 

159 

165 

183 

2 26 

5 

27 

45 

87 

101 

107 

111 

117 

125 

135 

2 27 

39 

79 

111 

115 

135 

187 

199 

219 

231 

235 

2 28 

57 

89 

95 

119 

125 

143 

165 

183 

213 

273 

2 29 

3 

33 

43 

63 

73 

75 

93 

99 

121 

133 

2 30 

35 

41 

83 

101 

1 

105 

107 

135 

153 

161 

173 

2 31 

1 

19 

61 

69 

85 

99 

105 

151 

159 

171 

2 32 

5 

17 

65 

99 

107 

135 

153 

185 

209 

267 

2 33 

9 

25 

49 

! 79 

I 

105 

285 

301 

303 

321 

355 

2 34 

41 

77 

113 

131 

143 

165 

185 

207 

227 

281 

2 35 

31 

49 

61 

69 

79 

]21 

141 

247 

309 

325 

2 36 

5 

17 

23 

65 

117 

137 

159 

173 

189 

233 

2 37 

25 

31 

45 

69 

123 

141 

199 

201 

351 

375 

2 38 

45 

87 

107 

131 

153 

185 

191 

227 

231 

257 

2 川 

7 

19 

67 

91 

135 

165 

219 

231 

241 

301 

2 4 ° 

87 

167 

195 

203 

213 

285 

293 

299 

389 

437 

2 41 

21 

31 

1 

63 

73 

75 

91 

111 

133 

139 


11 

17 

33 

53 

65 

143 

161 

165 

215 

227 

2 43 

57 

67 

117 

175 

255 

267 

291 

309 

319 

369 

^44 

17 

117 

119 

129 

143 

149 

287 

327 

359 

377 

245 

55 

69 

81 

93 

121 

133 

139 

159 

193 

229 

2 46 

21 

57 

63 

77 

167 

197 

237 

287 

305 

311 1 

2 47 

115 

127 

147 

279 

297 

339 

435 

541 

619 

649 

2 48 

59 

65 

89 

93 

147 

165 

189 

233 

243 

257 
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■ 

N 


^2 


^4 


1 

“6 

Ol 

a s 

“9 

a 10 

2 59 

55 

99 

225 

427 

517 

607 

649 

687 

861 

871 

260 

93 

107 

173 

179 

257 

1 279 

369 

395 

399 

453 

2 63 

25 

165 

259 

301 

375 

387 

391 

i 409 

457 

471 

2 64 

59 

83 

95 

179 

189 

257 

279 

I 323 

353 

363 

10 6 

17 

21 

39 ! 

4) 

1 

47 

69 

83 

93 

117 

137 

丄 0 7 

9 

27 

29 : 

57 

63 

69 

71 

93 

99 

in 

10 8 

11 

29 

41 

59 

69 

153 

161 

173 

179 

213 

10 9 

63 

71 

107 

1 

117 

203 

239 

243 

249 

261 

267 

10 io 

33 

57 

71 

119 ! 

149 

167 

183 

213 

219 

231 

10 11 

23 

53 

57 

93 

129 

149 

167 

171 

179 

231 

10 12 

11 

39 

41 

63 

101 

123 

137 

143 

153 

233 

10 16 

63 

83 

113 

149 

183 , 

191 

329 , 

357 

359 

369 


小于/ V 的10个大的素数是 N ~ a t ，…， N - « 1() 


实际上已经知道一些大得多的特殊形式的素数，而且有时候求尽可能大的素数 
是重要的。因此，在本节的末尾让我们来研究一下发现那些已知最大素数的有趣方 
式。这样的素数都有 2〃- 1的形式，其中”是各种特殊的值，因此它们特别适合于 




除非72为素数，否则，形如2” - 1的数不可能是素数，因为 2^-1 可为 2" -1 


整除。 1644 年， Marin Mersenne (梅森）指出，实际上对于 p -2,3,5,7,13,17,19, 


31，67，127,257，数26-1都是素数，而对于其它小于257的则都不是素数。这 

使得他的同时代的人大为 fe 奇 0 (这个命题是在他的 Cogi tat a Physico-Ma thematica 
的前言中联系完全数的讨论而出现的。奇怪的是，他还作了如下的注释 ：“要 问一个 
给定的15或20位数字是否素数，无论用什么已知的办法，即使用尽全部时间，也不 
足以测定。”）梅森早年经常同费马、笛卡尔以及其他人就类似的课题进行通信联系， 
但他对于这一论断没有给出证明，而且过了 2⑻多年之后也没有人知道他正确与 


否。欧拉在用了几年时间尝试证明这一事实屡遭失败之后，终于在 1772 年证明了 
2 31 - 1 是素数。大约 100 年后， Lucas 发现 2 127 - 1 是素数，但 2 67 - 1 是有问题 


的； 因此，梅森的论述不完全准确。然后1883年， I . M . Pervushm 证明了 2 61 


— 1是素 


数[参考 Jsforiico-Mat. Issledovani(Sh6 ( 1953) , 559 ] ，这增加了人们的推测，以为梅森 

只是出了抄写错误，即把61写成了 67。最终梅森命题的其它错误被发 现了； 如同某 
些早期的学者们所曾经猜测的那样， R . E . Powers[AMiW 18 ( 1911 ) ，195 ] 发现2 89 - 1 
是 素数； 而且过了 3年之后，他证明 2 1G7 - 1也是素数。 M . Kraitchik 于1922年证 

明，2 257 - 1 不 是素数[参见他的 Recherches sur la Theorie des Nomberes ( Paris : 

1924),21]; 计算的错误可能已经潜入他的计算当中，但他的结论已证实是正确的。 

形如 2 p - l 的数现在被 称为梅森数， 而且已经知道，对于等于 

2,3,5,7，13，17，19,31，61，89，107，127,521，607，1279,2203,2281， 


3217,4253,4423,9689,9941,11213,19937/21701,23209,44497,86243 ， 
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110503,132049,216091,756839,859433,1257787，1398269,2976221 


(26) 


的梅森素数。在底部 一 行的大多数数是由 David Slowinski 和他的助手们在调试新 


的超级计算机时发现的[请见 Uecreationa/ 11 ( 1979)258 〜 261 ] 。 在 20 世纪 
90 年代他和 Paul Gage 合作发现了 756839，859433 和 1257787 。 然而，两个当前最 
大的指数 1398269 和 2976221 分别是由 Joel Armengaud 和 Gordon Spence 使用不再 


流行的个人计算机找 到的；他扪 使用由 George Wohman 所编制的一个程序。此人 
于1996年发起了伟大的互联网梅森素数寻找工程 （ GIMPS )， 注意在 （26) 中未出现 
素数8191 = 2 13 -1;梅森已经指出过，2_ -1 是素数，而且其他人也已猜测，任何梅 


森素数也许还可用在指数中 


对于大的素数的查找还未被系统化，因为人们一般地都试图建立一个难 以打破 
的世界记录而不愿对较小的指数花费 时间； 例如，在 1983 年证实了 2 132 _-1 是素 
数 ，在 1984 年证实了 2 216091 - 1 ， 但是在 1988 年之前还未发现 2 H0503 -l o 因此小于 
2 2976221 -1 的一个或多个未知的梅森数仍然可能存在。（根据 Wohman ， 到 1997 年 5 
月 26 日为止，直到 1 000 000 的所有指数都已被检验，而他的志愿者们正在填补剩 
下的空隙。） 


由于2 2976221 -1 接近有900 000位十进数字，显然已经使用了某些特殊的技术 
来证明这样的数是素数。（事实上，1996年4月12日，对2 1257787 - 1所做的初始验 
证，在 Cray T 94 上花费了少于 8.3 个小时的时间。1997年8月对于2 2976221 - 1的 
初始验证，在一台 100 MHz 的奔腾计算机上花费了 15天。）关于检验一个给定的梅 
森数 - 1的素性的有效方法，首先是由 K Lucas 给出的 [ Amer . J . Math 。 1 
(1878) ，184 〜 239，289〜321，特别是316页]，并由 D . H . Lehmer 作 了改进 [Annals 
of Math . 31 (1930)，419〜448,特别是443页]。 Lucas-Lehmer 的检验，是当 n + 1 
的因子已知时，检验72的素性现在所用方法的一个特殊情况，其内容 如下： 


定理 L 设 q 是奇素数，并通过规则 

L 0 = 4， L w + 1 = ( L 2 n - 2) mod (2 9 - 1) (27) 

定义序列 （ L n )。 于是是素数，当且仅当 L q _ 2 = 0 

例如，2 3 -1是素数，因为 L 1 = (4 2 -2) mod 7 = 0 o 这个测试特别适合于二进计 

算机，因为计算 mod (2"-1) 是非常方 便的； 参考 4.3.2 小节。习题 4.3.2-14 说明 
当 g 极端地大时如何节省时间。 

证明通过考察一些本身有独立价值的递推序列的若干特性，只须使用非常简 
单的数论原理就能证明定理。考虑由规则 


U 0 = 0， U { = 1, U t! + [ = 4 U r] - 

= 2， V i = 4 y ^ +1 = 4 - V n _ { 

定义的序列和〈八>。用归纳法，容易证明下列等式 

V ,= 队 + 1 - U n . { (29) 


U n = ((2 + 乃）” -(2 -4?> Y)l / l 2 (30) 
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V , = (2 + V 3 ) tt + (2 - AY (31) 

U m + n = U m U 7} + [ - U m _! U n (32) 

当户是素数且时，我们现在证明一个辅助性 结果： 

如果 U n = 0 (modulo p e ) ,贝 1」 U n p = 0 (modulo p e + l ) (33) 

这可以从习题 3.2.2-11 的更一般的考虑得出，但也可以给出序列 （28) 的直接证明。 
假设 U n = bp e ， U 1] + i = a 。 由 （32) 和 （28) ， = bp e (2 a - 4 bp e )=2 aU n (modulo 

纩 + 1 )， 同时我们有 U 2ri + 1 = U 2 n + L - Ul 三 a 2 。 类似地， U 2n + l U „ - U 2 n U n . l 

三 3 a 2 L/„ 且 L/ 3 „ + 1 = L/ 2r? + 〖R + 1 - U 2ri U„ 三 a 3 。 一 般地， 


U ktl 


ka 


— l 


U 


71 


U kn 


+1 


a k (modulo 



所以如果我们取 A = p， 则 （33) 得证。 

从公式 （30) 和 （31)， 用二项式定理展开（2±乃广，我们可以 得到％ 和 V n 的其 


它表达式: 


U 


n 



n 


\2 k + 1 / 


2 


n^2k — \^%k 



V , 二 



2 


n 


-2^ + 1 



现在如果置 77 ，其中 P 为一奇素数，而且如果使用这样一个事实，即除当 


(34) 



或是= 



是 p 的倍数，则我们求得 


Up = 3 (/,_1)/2 , V p = 4 (modulo p ) (35) 

如果 p 尹3,则费马定理告诉我们3》— 1 三1;因此 （3 ( ^ 1)/2 -1) x (3 ( p — 1)/2 + 1)三0, 
且 3( 广 1)/2 三土 1。当 U p ^~l 时，我们有 U p ^ = 4 U p ~ LV . 1 = 4%+ V , - U p + l 
三 - L /” 1; 因此 U p — mod 户=0。当 U p = + 1 时，我们有 U P — ' = 4 U P - U p + X : 
4 U p - V p - Up-i = ~ L/n ;因此 U p - ! mod p = 0 。我们由此证明了对于所有的素 
数户，有一整数 〆 /))，使得 

U P + ( ( P ) mod /> = 0, | f (/?) | < 1 (36) 

现在如果 N 是任意正整数，而且如果 m = m ( N ) 是使得 U m(N) mod iV = 0的 
最小正整数，则有 

U n mod N = 0 当且仅当 ^是 tt2 ( N ) 的倍数 （37) 

(这个数 m ( N ) 称做 N 在序列中出现的秩。）为证明（37)，注意到序列 U my U m + ly 

U m + 2 ，… (modulo iV ) 同余于《(7 0 ，<2[7 1 ，<21/2，‘‘.，其中0=1^ + 1 mod N 与 N 互素， 

因为 + 

通过这些预备知识，我们做好了证明定理 L 的准备。由 （27) 和归纳法 


L n = V 2 n mod (2 r/ - 1) (38) 

而且，恒等式 2L/„ + 1 = 4R+ %意味着 gcd ( L 7„， V „)<2, 因为 R 和八 的任何公 

因子必整除和2% + 1 ，而[7„丄17„ + 1 。所以 R 和没有公共的奇因子，而且 


參 
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如果 L 9 _ 2 = 0,则必有 

U 2 q ~ l - U 2 g ~ 2 V=0 (modulo 2 q - 1) 

U 2 q ~ 2 ^0 (modulo 2 q - l ) 

现在如果 m = m (2"- l ) 是 2 g -1 出现的秩，则 m 必然是 Y — 1 的，但非— 2 的 

一个 因子； 于是 ml - 1 。 我们还将证明 71 =2^~1 因此是素 数：设 n 的因子分解 
是 p e y .. P ? 。 所有素数九皆大于3,因为？7是奇数且同余于（_ 1) <7 - 1 = - 2 (modulo 
3)。由（33)， （36) 和（37)，我们知道 U = 0 (modulo 2。 - 1) ，其中 

t = lcm ( p e f Y ( p Y + h ) ，…， 〆，— L (/> r + v )) 

而且每个〜是±1 。因此，是爪二2 7-1 的倍数。设72。=117 =1 乃—我们有 

心 < n» _l (A + yA ) = ( 音)还由于 Pj + 是偶数，所以，这 
是因为，每次取两个偶数的最小公倍数时，就失去了一个因子2。把这些结果结合 

在一起，我们就有吾)？2<4(音; m <3 m ; 因此 r <2 且 t = m 或^ = 

2 / nJ 卩2的乘幂。因此~ = 1，~ = 1，而且如果《不是素数，则必定有 n =2 Q - 1二 

a + DUrl )， 其中 2& + 1 和2/- 1是素数。但当是奇数时，后者显然不可能， 
所以 n 为素数。 

反之，假设 n =2 g _ l 为素数，我们必须证明 V 2 -^0 ( module ^)。 为此目的， 

只须证明 1 三 _ 2 (modulo ” ） 就行了，因为 V^ -1 = ( ) 2 — 2。现在 

V ，！ =((V2 +V6)/2) n + 1 + ((V2 -46)/2y + [ = 


由于 



n + l~2k 


V6 


2k 






n 是奇素数，故除了当 2々= 0 和 2々 =rz + 1 夕卜， 



V 2k ) 



可为〃 整除； 因此 

2 ( ， ,_1)/2 V 2 d = 1 + 3 (n + 1)/2 (modulo 77 ) 

这里 2=(2 u + i ) /2 ) 2 , 所以由费马定理2 ( ”- 1)/2 = (2 (<7 + 1 ) /2 )(” _1 )三1。最后，由于二次 

互反律（参考习题 23) 的简单情况， 3 U_l)/2 三 - 1 , 因为 n mod 3 = l 和 rz mod 4 = 3 0 
这意味着 V 2 "- i 三 - 2,所以如所希那样必有 V 2 ^2=0 o I 

一 位其著作现在保存在意大利图书馆的佚名作者在1460年发现了 2 17 -1和 
2 19 - 1 是素数[请见 E. Picutti , His tori a Math. 16 (1989) ， 123 〜 136] 。自那以后，世 

界上明确知道的最大素数几乎一直是梅森素数。不过情况大概要起变化，因为梅森 
素数越来越难找，还因为习题27给出了对其它形式的素数的有效检验方法。 
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习 



1. [10] 如果算法 A 中试验因子的序列…包含一个非素数的数，试问它为什么不 
可能出现于输出中？ 

2. [75] 如果已知对算法 A 的输入 iV 等于3或更大，问步骤 A 2 可否消去？ 

3. [ A /20] 证明有一个具有下列性质的数 P : 如果 1000< r ?<1000000, 则当且仅当 gcdU ， P ) 

=1时 r ? 为素数 o 

4. [ M 29] 在习题 3.1-7 和 1.2.11.3 小节的记法下，证明使得:的最小的”的平 

均值介于 1.5 Q (/ n ) -0.5 和 1.625 Q ( m ) - 0.5 之间。 

5. [21] 当取模数3,5,7,8和11时，用费马方法（算法 D ) 并用手算来求11111的因子。 

6. [ M 24] 如果声为一奇素数，且 N 不是 p 的倍数，证明使得0<工</)和： r 2 - N = y 2 ( modu - 

lo /) ) 有一个解 y 的整数工的个数等于（户±1)/2。 

7. [25] 当模叫的表项不能恰好填满整数个存储字时，讨论在一台二进计算机上对算法 D 

的筛进行编程的问题。 

► 8. [23] ( Eratosthenes 筛，公元前3世纪）下列过程显然能发现小于一个给定整数 N 的所有 
奇素数，因为它筛去所有的非素数；从所有1和 N 之间的奇数 开始； 然后对于々= 2,3,4,…直到 
达到使 p \> N 的一个素数仏，逐个地去掉第々个素数久的倍数 九十 2)，九（％十 4 )，"- 

试说明如何把刚才描述的过程编成一个能直接在计算机上进行有效计算且不使用乘法的算法。 
9.[ M 25] 设 rz 是一个奇数， n >3。 证明如果定理31 .2. B 的数 AU ) 是 n ~ l 的因子但不 

等千 n - 1，则必有 p t 的形式，其中诸 p 是不同的素数而且纟>3。 

► 10 . [ M 26] (John Self ridge ) 证明，如果对于” - 1的每个素因子 p ，都有一'个数使得 

但 X ；" 1 mod » = 1，则《 为素数。 

ll .[ M 20] 当 n = 197209 4 = 5,772 = 1 时，算法 E 给出什么输出？[提示：197209 = 992十 
//1,495,2,495, l ,1984// 0 ] 

► 12.[ M 2 S ] 试设计一个算法，它使用算法 E 的输出来求 N 的一个真因子，假定算法 E 已经产 
生足够的输出以推导 （18) 的一个解。 

13. [// A /25]( J . D . Dixon ) 证明每当习题12的算法给出一个解（: r ，以，…，‘ ） ，这个解的指数 

同以前的解的指数模2线性相关，且当 n 有 d 个不同的素因子，: r 随机地选择时，找不到一个因 

子分解的概率是2〃夂 ^ 

14 JM 20] 证明算法 E 的步骤 E 3 中的数了不可能是奇素数的倍数，其中 UN) (/7_1)/2 mod 


P>lo 

► l 5.[ A /34]( Lucas 和 Lehmer ) 设 P f Q 是互素的整数，而且设 U 0 = 0, L/i - 1，且对于 n > l , 
U ri + , = PL /, - QU, t - lc 证明 ：如果 N 是与 2 P 2 -8 Q 互素的正整数，而且如果 U N + , mod N - 0 , 
同时对于每个整除 N + 1的素数 p , U (N + l ) i P mod N 尹0，则/ V 是素数（当已知 N + 1的因子而不 
是 N - 1的因子时，这给出了对素性的一个测试。如同在习题 4.6.3-26 中一样，的值可在 O 

(log m ) 个步骤内计算出来。[提 示： 见定理 L 的证明。] 

16. [ M 50] 有无限多个梅森素数吗？ 

17. [ A /25]( V . R . Pratt ) 用费马定理的逆来进行素性的一个完备的证明，采取树的形式。这 
树的节点有 （ y ， x ) 的形式，其中 g 和1是满足下列算术条件的正整数。 （ i ) 如果 U "^)， …， 
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( g ,， A ) 是 （g , jc ) 的儿子，贝 ll q = Qiq 



[特别是如果 （ g ， x ) 没有儿子，则^ = 2。](1〖）如果（;-， 


: y ) 是 （ g ，: c ) 的儿子，贝 !j : r ( 9 I)/r mod qy^lo ( iH ) 对于每个节点 （ g ， jc ) 有 x 
件得出，对于所有节点 U ，* r )， g 是素数且 i 是一个模/>原根。[例如，树 

(1009,11) 


(7 一 1 


mod q 


由这些条 


(2，1) 


(2，1) 


(2J) 


(2J) 


(7,3) 


(3,2) 


(3,2) 


(2，1) 


(3,2) 


(2J) 


( 2 , 1 ) 


(2J) 

显示，1009是素数。]证明具有根 （) 的这样一棵树至多有/(9)个节点，其中/是一个增长很 
慢的函数。 



IS . [ NM 23] 仿照正文中对 (6) 的推导给出 




个 （7) 的启发式证明。什么是的近 


似概率? 


► 19. [ M 25]( J . M . Pollard ) 说明怎样来计算一个数 M ， 它可被所有素数 p 所整除，且使 />- 1是 
某个给定的数 D [提 示：考 虑形如 a t 7 ~ l 的数]的一个因子。这样一个 M 在因子分解中是有用 
的，因为通过计算 gcd ( M ，/ V )， 我们可以发现 N 的一个因子。试把这个思想推广为一个有效的方 
法，当/>-1的所有素幂因子中，除至多一个素因子小于10 5 外，其它都小于10 3 时，这个方法能以 
很高的概率发现一个给定的大数 N 的诸素因子[例如，通过这个方法将发现整除 （15) 的第二 
个最大的素数，因为它是1 + 2 4 .5 2 ,67.107,199*41231。] 


20. [ M 40] 在以 p + 1代替 - 1的情况下，考虑习题19。 


[ M 49] ( R . K . Guy ) 设 m ( p ) 是算法 B 为找出素因子户所需的迭代次数。当 


⑺时， 


m 


( p ) 


0 ( 


p log /> ) 吗？ 


► 22. [ M 30]( M . O . Rabin ) 给定大于等于 3 的奇整数《，设匕是算法 P 猜错的概率。证明对 


所有 n ， p n < A !4 


23. [ M 35] 对所有整数{>◦，及所有奇整数 9 >1，当？为素数时 ，雅可比符号 通过规 


则 


上 

Q 


^ ( "' l)/2 (modulo (?) 定义为 -1,0 或+ 1;当是〖个素数的乘积 A (不必不同）时， 


上 


上 


上 


这样它推广了习题 1.2.4-47 的符号。 


a ) 证明 


f ) 满足下列关系’因此它可被有效地计算 


0 ; 




9l\ A 1 


(-l) 


1)/8 


PP 


上 


岌)； 如果 p 和都是奇数，则(上 


- 1 ) 


(p - 1)( q - 1)14 ( Q 


_后 一 定律是把 f 


上 


的计箅归结为的计算的互反关系，当 p 和 9 


皆为素数时，它已在习题 1.2.4-47( d ) 中被证明，所以在该特殊情况下你可以假定它的正确性 


b ) ( Sdovay 和 Strassen ) 证明如果 n 是奇数但不是素数，使得和0# 


x 


n 


x 


1 (modulo r ?) 的整数 


X 


的个数至多是 


cp ( n)o (因此，对所有固定的〃，下列的检验过程以 
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至少+的概率正确地确定 n 是否素数 ：“随 机地生成满足1<^< 72的: r ， 如果0 尹 


X 


71 


X 


0/2 (modulo n )， 则说72可能为素数，否则说 n 肯定不是素数。”） 

c ) ( L . Monier ) 证明如果 n 和 x 是使得算法 P 作出结论 “ n 可能为素数”的两个数，则0 关 


X 


X 


1)/2 (modulo n )。 [因此算法 P 总是优越于 b ) 中的检验。] 



24. [A/25](L. Adi 


和 o ;> l 是整数，《为素数时，我们说 


通过算法 P 的 


X 


检 


验”，如果 ： r mod 77 =0或者如果步骤 P 2 〜 P 5 导致 n 可能是素数的结论的话。证明对于任何 W ， 


存在一组正整数^， 


* ♦參 


< N & m<Llg N 」， 使得在 l < n < N 范围内的一个奇正整数是素数， 


当且仅当对于 x — mod n y -' y x — x 


m 


它通过算法 P 的: r 检验。因此关于素性的概率检 


验原则上可以转换成一个不靠概率的有效检验（你不需要说明怎样有效地计算 
存在）。 


X ：: 


只须证明它们 


25.[/ / A /4 J ]( B . Riemann ) 证明 


7T 


(工）+ - 


X 


1/2 


+ 


7T( X 


1/3 




^ dt 




In 


-2 E 


( / + i r) In 


dt 




IT 


0 ( 1 ) 


其中求和对所有使得1">0和？(。+ ^)=0的复数^ + ir 进行。 



26 ■ [ M 25] ( H . C . Pockiington , 1914) 设 


介+ 1，其中 



每个素因子 /) 存在一个整数 A 使得 


X 


N 


mod N = gcd( x[ N " 以 — 1 ， N) 


证明：如果对于/的 
，则 N 是素数。 



27. [ M 30] 证明有一个方法来检验形如 N 


2” + 1的数的素性，该方法使用和 Lucas 


Lehmer 在定理 L 中检验梅森素数近似地相同的取平方模 N 的个数。[提示 ：见上 题。] 


[ M 27] 给定一个素数和一个正整数整除 A 


(计算重数）的平均次数 f ( p 9 


的值是多少？其中 A 和 B 是随机整数，它们彼此独立，但必须满足 A 丄 B 的条件。 
29. [ M 25] 证明小于等于〃，且其素因子全都包含于一个给定的素数 集合丨 仏， 

整数个数至少是 m r /r !,其中 r = Llog n / log 〜」且 pi < p ni 。 




的正 


[ HM 35](]. D . Dixon 和 


设 


■ 


< p m 是素数，它们不整除奇数 


并设 r^log N/log 
X 的个数至少是77 


是一个偶整数。证明在 0< X < N 范围内使得 X 2 mod N = p e '、 …的整数 


X 的个数至少是 mVr ! 提 示：设 iV 的因子分解为 

对于是一个二次余模仏时，指数 （ q ， 


七，证明每当我们有 


+ 


蠡 ■書 


+ e — < r 且 


e 


) 的序列导致 Y 个解 X 。这样的指 


数序列可以作为有序偶 U ;， …，4; 〆 ;，…， O 而得到，其中4 +…+ « + r 且 〆 ;+…+ 
r 且对于 

( 〆/…/4； 1 ) (9 「 1)/2 三 (< 】 … 乂？ ) （ V 1)/2 (modulo t) 

31.[ M 20] 使用习题 1.2.10-21 来估计 Dixon 的因子分解算法（在定理 D 前边已有介绍）获 
得少于 2 m 个输出的概率。 

>32. [ M 32] 说明如何修改 RSA 编码方案，使得对于 小于^ ^的消息不存在任何问题，即消息 
的长度不会大量地增加。 

33. [ M 50] 证明或否定：给定一个数 A /=/) q ， 它的素因子满足 p = q =2( modu\o 3) ，而且给定 
■ r 3 mod N 的值，则有一个相当有效的算法，它有能力以不可忽略的概率找出 N 的因子。[如果这 
可以证明，它将不仅说明立方根的问题和因子分解一样困难，而且它还将说明， RSA 方案和 SQRT 
方案一样有致命的缺陷 0] 
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34. [ yVT 30]( Peter Weinberger ) 假设在 RSA 方案中 N =网，并假设你知道一个数对于至 
少 1 CT 12 的所有正 整数： r 有:^ mod N - l 0 如果 m 不太大（比如说 m < / V 1G ) ，说明你将不太困难 
地来对 A / 进行因子分解。 

► 35. [ M 25] ( H . C . Wi [ Uams ，1979) 设 /V 是两个素数 f 和 g 的乘积，其中 /> mod 8 = 3和 
q mod 8 = 7,证明雅可比符号满足 (-#) = [ f )= - (_)，并使用它来设计一个类似于 Rabin 

的 SQRT 箱的一个无消息二义性的编码/译码方案。 

36. [ HM 24] 除非 IV 极其大， （22) 后边的渐近分析对于给出有意义的值来说太粗糙了，因为 
当/ V 在一个实用的范围中时 ， In In / V 总是比较小的。试进行更精确的分析，以便对合理的 N 值 
能进一步了解 （22) 的特性；并说明如何选择 In w 的一个值，除了顶多 exp ( 0( log log / V ) ) 大小的 
因子外，它极小化（22)。 

37. [ M 27] 证明每个正整数 D 的平方根有形如 

= R + // 〜，一，、，2尺，〜，‘..，〜，2尺，<2 1 ，.-‘，(2 >7 ,2尺，."//的周期连分数，除非0是一 

个完全的平方根，其中及=4/^」且（心，…〜）是一个回文（即对于 \« n， ai = a … 

38. [25] (无 用的 素数） 对于0<3<9,试求心，即最大的50位十进数字的素数，它有等于 d 

的极大的十进数字的个数。（首先把^的数极大化，然后求最大的这样的素数。） 

39. [40] 许多素数/>都有这样一个性质， g 卩2/> + 1也是一个素数。例如， 5—11 —23 — 47。 
更一般地说，对于某个^>0,如果 /) 和^都是素数，而 9 = 2> + 1，就说 g 是 p 的一个 后继。 例如 

2 — 3 — 7 — 29 — 59 — 1889 — 3779 ^ 7559 — 4058207223809 -- 32465657790473 — 
4462046030502692971872257—95(30 位被省略的数字 ）37 —…;95…37的最小后继有103位十进 
数字。试求出你能求的最长的逐次的素数链。 

► 40. r L vW 6]( A . Shamir ) 考虑一台抽象计算机，它能在仅仅一个单位的时间内对任意长度的整 
数1和3^实现2十3^-^，2 1和1_^/3；」的运算，不管这些整数有多大。这个机器把整数存入一 
个随机存取的内存中，而且给定 x 和它能取决于是否 -r = ^来选择不同的程序步骤。本题的 
目的是说明，在这样一台计算机上存在令人惊异地快速的方法来对数进行因子分解。（因此大概 
很难证明在实际的机器上进行因子分解是固有地复杂的，尽管我们猜测它是复杂的。） 

a ) 给定一个整数值77>2,试找出在这样一台计算机上以 0 (log n ) 的步骤计算 n ! 的方法。 

[提示 ：如果 a 是一个充分大的整数，则由 （ a + ir 的值可以容易地计算二项式系数 = 切！/ 

(m ~ k )\ ^ ! o ] 

b ) 给定一个整数值 说明如何在这样一台计算机上以 0( bg 幻的步骤计算有下列这样 

性质的数 / U ): 如果 n 是素数，则 /(〃）= 〃； 否则 / U ) 是 M 的一个真因子（但不必是素数〉。[提 

示：如果尹4，一 个这样的函数是 gcd ( (?7〉， 77 〉，其中 m () — min \m m \ mod 7 ? = 0 丨。 ] 

[作为 b ) 的一个推论，我们通过对任意大的整数只做 0 (log T 7) 2 个算术运算，就可对一个给定的 
数 Z 7 进行完全的因子分解。给定一个部分的因子分解每一个非素数 77, 都可以在 

SO ( log ^)- O 0 og 幻的步骤内被 / U ,)* U ;// U ; )) 所代替，而这个求精运算可以重复进行直 
到所有〃，都是素数为止。] 

► 41 ■ [ M 28 ] ( Lagarias , Miller ffl Odlyzko ) 本题的目的是说明通过只观察小于 iV 2 的素数就可计 
算小于 N 3 的素数个数，因此可在 0( N 2+( ) 步内计算 tc ( N 3 )o 

我们说一个幸存者”指的是其素因子全都超过 m 的一个正 整数； 因此，一个 m 幸存者是 
在小于等于 m 的素数的所有倍数都被筛出之后的 Eratosthenes 筛（习题 8) 中剩下来的 。 ♦ fU ， 
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m ) 是小于等于： r 的 m 幸存者的个数，而令是恰好有々个素因子（计算重数）的这样的 
幸存者的个数。 

a ) 证明 W ) = tt ( N ) + /( N 3 , N )- 1 -/ 2 ( N 3 , N)o 

b ) 说明如何对于 ： r < N 2 从 ； rCr ) 的值来计算 / 2 ( N 3 , N ) o 用你的方法手算/ 2 (1000，10)。 

c ) 和问题 b ) 相同，但不是算 / 2 (/ V 3 ，/ V )， 而是计算 jXN \ N)o [提示 ：使用 恒等式 / Cr ， 巧） 

= / U ，/^) -/(工/巧，/^)，其中是第 J 个素数且〜=1。] 

d ) 试讨论用于有效计算 b ) 和 c ) 中的 M 的数据结构。 

42 . [ M 35 ] ( H . W , Lenstra , Jr .) 给定0< r < _ s . < N 且 r 丄、■和 iV 丄 5 。试证通过对 （lg N ) 个二 
进位的数实施 0(「 iV / 夕 ~| 1/2 log s ) 次明确选定的算术运算，有可能找出同余于 r (modulo _0的 N 的 
所有因子。[提 示：应 用习题15.3-49。] 

► 43. [ A /43] 令 m 二妁是定理 3.5 P 中 那样的 r 个二进位的 Blum 整数，并设 Q w = \ y\y = 
mod m ，对于某个工丨。于是有（/> + 1)(9 + 1)/4 个元素，而且每一个元素 ： y G 有惟一的根 

工二^；，使得^ e Q m 0假设 G (30 是当3^ & Q,n 的一个随机元素时，以大于等于<的概率正确 


地猜测 mod 2的一个算法。本题的目的是证明由 G 解决的问题几乎和对 m 因子分解的问题 
一 样难。 

a ) 试构造一个算法 A ( G ， m ，^3 sS )， 它使用随机数和算法 G 来猜测一个绐定整数 _ y 是否在 

Q m 中，而无需计算你的算法应该以大于等于 1- S 的概率正确地猜测，而且若假定 T ( G )> 
r 2 , 则它的运行时间 7( A ) 至多应是 0( r 2 ( l 0 g d ~ l ) T ( G )) 0 (如果 T ( G )< r 2 , 则在这个公式 
中以 （ T ( G ) + r 2 ) 来代替 T(G)o) 

b ) 试构造一个算法 F ( G ， 772 ,（），它以预期的运行时间 7( F ) - 0( r 2 ( r 6 + r 4 ■ 
( tog 厂 OTXG ))) 来求 w 的因子。 

[ 提示：对于固定的 ： yG Q,„ ，以及对于 m ， 设 tv = v 4y mod m 和 At; = rt; mod 2 。注 
意 ，; l ( — u) + Xv = IE. A (+ … + v n ) - (At；! + *^ + A^„ + L( ， + … + )/ ⑺」) mod 2 。其次我 


们有 


V 




TV 



mXv ); 这里^ ~ w 代表 


m 



v Imod m 


如果 ± r ，我们有 r ( ± i ; 


= 因此算法 G 给了我们以大约所有 ^ 的一半来猜测 At ; 的一个方法。] 

A 4.[ M 35] ( J . Hastad ) 证明，如果对于 ， w , 丄 ， 则当对于 l < z '<7, a /0 + a n x + 

ai2X 2 + a ； 3 ^ 3 = 0 (modulo ) 9 0< x < m } , gcd ( a /0 , a n , a i2 , ^；3 ， W /) = 1 且 > lO * 7 时，不难 求工。 

(所有变量都是整数，除 . r 之外全都已知。）提 示：当 L 是实数的任何非奇异矩阵时， Lenstra ， 
Lenstra 和 Lovdsz 的箅法 [ MafhemaD . se/ie Annaien 261 (1982) ，515 〜 534] 有效地求—个非零整向量 

r =( h ， …，％)，使得长度 |det L | ll \ 

► 45 . [ M 41 ] (J . M . Pollard 和 Claus-Peter Schnorr ) 证明：给定整数 a ， 6 和？ ? 且 丄? 7 且”为 

数，即使〃的因子分解是不知道的，但仍存在一个有效的方法来求解对于整数^和 _ y 的同余式 

X 1 - ay 1 三 b (modulo n ) 

[ 提示：使用恒等式 （4 _ ay] )(oc\ - ay]) ~ x 1 ^ ay 1 ，其中 x — x^x 2 ~ “ 九、 ,] 且 ：V = 工 1)2 + ^'2^1 o] 

46.[/ / A /30] ( L . Adleman ) 设 /) 是一个相当大的素数且设 a 是一模/> 原根； 于是，在范围 
中的所有整数对于满足 Kn < p 的某个惟一的/7,可写成 mod 0。 

试设计 一 个算法，它使用类似于 Di xon 的因子分解算法的思想，对于所有的 f 〉0，对于给定的 
6,在0( 〆 ）步骤内，几乎总能找到”。[提 示： 通过构造数〜的一个所有组成开始，使得 
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a n i mod /> 只有小的素因子 。] 

47.[ M 50] 以 ASCII 码表示的某个文字摘录 i = Ah ，有一个加密了的值 （4 mod / V ， 

^2 mod N ) = 

(14E97EF5C531D92591B89CDBAB48444A04612C01AA29C2A8FA10FA804EF7AC3CE03D7D3667C4D3E132A24A68 

E6797FE28650DC3ADF327474B86B0CBD5387A49872CE012269A59B3E4B3BD83B74681A78AD7B6D1772A7451B, 

15B025E2AEE095A9542590184CF62F72B2E8E8DD794AEF8511F2591E6BC2C8B8A8E48AF1FE04FF2FD933E730 

9205A3418DBB9BB8C6A7665DA309531735FE86C741D1261B34CB2668FA34D0C0C28575A2454E3DB00E408AC7) 

这是在十六进制下，其中 N 是 

17B2353B9595ECA69FEF80940160C4084286D1255FFE49D114F2E633F82C88D5224FC4AA6F9104CED2BCA810 

BEA76157FFDC78F9656AOED9B3F6CCAB99001B8B2571F4EBD095925F07F9BEE5111E8375DFD71593628AD8D1 

问 1 是什么？ 

The problem of distinguishing prime numbers from composites 9 
and of resolving composite numbers into their prime factors , 
is one of the most important and useful in all of arithmetic . 

• ••The dignity of science seems to demand that every aid to the solution 

of such an elegant and celebrated problem be zealously cultivated • 

区分素数同合数，以及把合数分解成它们的素因子, 
在所有算术运算中是最重要和最有用的问题之一。 
…… 科学的尊严似乎要求，对于解决这样一个精彩驰名的问题 

的每一个帮助都应予以积极热情的扶植。 

- C . F . GAUSS , Disquisitiones Arithmetics f Article 329 (1801) 

4.6 多项式算术 

我们已经研究的一些技术可以自然地应用于许多不同类型的数学量上，而不只是 
数。这节我们将讨论多项式，它是数的下一步。形式地说， s 上的一个多项式是形如 

u ( x ) = + ■** + UyX + ^0 ( 1 ) 

的表达式，其中系数^，…，^，叫是某个代数系统 S 的元素，变量: T 可以看做带有不 

确定意义的形式符号。我们将假定，代数系统 S 是含1的可交 换环； 这意味着 S 允许 
进行加法、减法和乘法运算，并满足传统 性质: 加法和乘法是定义在 S 上的二元 运算; 
它们是可结合和可交换的，而且其中乘法对加法可分配。有一个加法的单位元素0和 
乘法的单位元素1，使得对于 S 中的所有的和 = 减法是加法的逆。 

但关于除法作为乘法的逆的可能性，我们不作任何假定。多项式 + w + 〜 + + 1 

+十…十十 M 被认为是和 （1) 相同的多项式，尽管它的表达式在形式上是不 

同的。 

如果、乒0,我们说 (1) 是一个〃次多项式且前导系数 为、; 在这一情况下，我们写 

deg ( u ) ~ Tij £{ u ) — u n (2) 
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按照约定，我们也置 

deg ( O ) = - 00 , ^(0) = 0 (3) 

其中0表示其系数全部为0的0多项式。如果前导系数 /U ) 二1，则我们说 uU ) 

是一首 一 多项式。 

多项式算术主要由多项式加法、减法和乘法 组成； 在某些情况下，进一步的运算 
例如除法，指数运算，分解因子以及求最大公因子是重要的。加法、减法和乘法是以 
一种自然方式定义的，就如同变量： c 是5的一个元素那 样：多 项式的加法和减法通 
过把同类的： c 幂的系数相加或相减来完成。乘法则通过规则 

( U,JC r + ••• + Wo) ( V^ S + *•• + t^o) = vu r + ! ； x r + s + + ZV Q 

来完成，其中 

U) k = u 0 v k + U[V k ^i + ••- + u k - x v x + u k v 0 ( 4 ) 

在后一公式中，如果或则〜或％被当做0。 

代数系统 S 通常是整数的或有理数的 集合； 或者它本身可以是一个（不同于0： 
的变量的）多项式 集合； 在后一情况下 （1) 是一个 多变量 多项式，即若干个变量的多 
项式。当代数系统 S 由整数0，1 ， …， m - 1组成，而且加法、减法和乘法是按模 m 
实现的（参考 4.3.2-(11)) 时，出现另一个重要的 情况； 这就是 所谓模 m 的多 项式算 
术。当每个系数是0或1时，即是模2的多项式算术，这个特殊情况是特别重要的。 

读者应当注意多项式算术和多精度算术 （4.3.1 小节）之间的类似性，在多精度 
算术中的进制6被换成为: r 。 主要差别是，多项式算术中 P 的系数％同它的相邻 

系数％ ±1 没有实质上的关系，所以不存在从一个位置到另一个位置“进位”的概念。 

事实上，除了不考虑进位外，模6的多项式算术实质上就等于进制为6的多精度算 
术。例如，比较在二进数系下的 （1101)2 乘以 （1011)2 的乘法同模2的 X 3 + X 2 -H 1 

和： r 3 + x + l 的类似 乘法： 

二进系统 模2多项式 


1101 

1101 

x 1011 

x 1011 

1101 

1101 

1101 

1101 

1101 

1101 

10001111 

1111111 


这些多项式的模2乘积通过免去所有进位而得到，因此它是： r 6 + : r 5 + / + z 3 十 
+ x + 如果我们把同样的多项式当做整系数多项式相乘，而不取模2的剩余， 
则结果将是 x 6 + x 5 + x 4 + 3 x 3 + x 2 + ^ + 1;进位再次免去，但在这种情况下，系数 
可以变得任意大。 

鉴于同多精度算术的这种强烈的类似性，在这节里已没有必要进一步讨论多项 
式的加法、减法和乘法。然而，应当指出通常多项式算术在实际应用中颇不同于多 

• 381 • 


第 4 章算术 


精度算术的某些方面 ：由于 多项式通常都有很多0系数的趋势，而且多项式次数通 
常很高，所以希望能有特殊形式的 表示； 见 2.2.4 小节。而且，多变量多项式算术的 
程序，用递归的结构最易于 理解； 第8章中要讨论这一情况。 

尽管多项式加法、减法和乘法的技术是比较直截了当的，但是多项式算术有某 
些其它重要的方面，值得特殊考虑。因此，在以下的小节内将讨论多项式的除法及 
其相关联的技术，诸如求最大公因子和因子分解。我们还将讨论有效求值的问题， 
即当 X 是 S 的给定元素时，要用尽可能少的运算求出 1/(1) 的值。当77很大时，非 
常快地计算/这一特殊情况十分重要，所以要在 4.6.3 小节中详细讨论。 

用来进行多项式算术的头一个重要的计算机子程序集是 ALPAK 系统 [W.S. 

Brown, j . P. Hyde 和 B . A . Tague , Bell Systern Tech . J . 42 ( 1963 )， 2081 〜 2119 ; 43 

(1964),785~ 804,1547 - 1562 ] 0 在这方面的另一个里程碑是 George Collins 的 PM 
系统 [CACM 9 (1966),578 〜 589]; 也见 C. L. Hamblin,Comp. 10 (1967),168 〜 


习题 

1. [ i 0] 如果做模 10 多项式算术，则 7 x + 2减 X 2 + 5等于多少？ 6 x 2 + o ； + 3乘以+ 2等 
于多少？ 

2. [17] 真还是假：（ 3 )首一多项式的乘积是首一的。 （ b ) 次数分别为 w 和〃的多项式的乘积 
有次数 w + r /。（ c ) 次数分别为 w 和;7的多项式之和有次数 max ( w , /?)。 

3 . [ M 20} 如果 （4) 中的每个系数心 ，…， ao ， ％ »…， 叫是满足条件 | w ,. | < | w 1 | ， | % | <爪 2 
的整数，则乘积系数的极大绝对值是多少？ 

► 4.[2 i ] 如果诸系数已被装入计算机的字内 ，瑪过 使用在一台二进制计算机上的通常的算术 

运算，能否便利地进行模2的多项式乘法？ ' 

► 5. [ A /24] 当77很大时，说明如何修改 Karatsuba 的方法（见 4.3.3 小节），以便用正比于 

OGA 3 ) 的执行时间来进行模2的次数小于等于77的两个多项式的乘法。 

4.6.1 多项式除法 

当算术是对于一个域上的多项式进行时，以一个多项式除另一个多项式，有可 
能像以一个多精度的整数除另一个多精度的整数那样进行。一个域 S 是带有幺元 
的可交换环，其中加法、减法和乘法及精确的除法都是可 能的； 通常这意味着当 w 和 
v 是* S 的兀素且时，有 S 中的一^个兀素，使得 u = vu ， o 在应用中岀现的最 
重要的系数 域是： 

a ) 有理数（表示成分数，见 4.5,1 小 节）； 

b ) 实数或复数（在一台计算机内借助于浮点近似值表示，见 4.2 节）； 

c ) 模 p 的整数，其中 p 是素数（其中除法可如习题 4.5.2-16 中所建议的那样 
实 现）； 

d ) 一个域上的有 理函数 ，即两个多项式的商的系数在该域中，分母是首一的: 
具有特殊重要性的是模2的整数域，其仅有的元素是0和1。在这个域上的多项式 
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(即模2的多项式）同二进记法下表达的整数有许多类似 之点； 而且这个域上的有理 
函数同其分子和分母以二进记法表示的有理数非常类似。 

给定一个域上的两个多项式 〃 U ) 和^(^)，1；(工）关0 ，我们可以用除 

w (: r ) 得到一个商多项式 gUO 和一个余多项式 r (: r )， 满足条件 

u ( x ) = q ( x ) • i ;( jr ) + r { x ) y deg ( r ) < deg ( ^ ) (1) 

容易看出，至多有一对多项式 （ 9 U )， r ( I )) 满足这些 关系； 因为如果相对于相同的 
多项式 w (: r ) 和 I ；(:(: c )) 和（9 2 (：1')，，2(* 2： ))都满足（1>)，则有 Qi ( ^ ) 

v(x) + r { (x) - q 2 {x)v{x) + r 2 (x ) ，所以 （ g! (: r ) — q 2 (x))v{x) = r 2 {x) - r 1 (.r ) c 
现在如果 q\(x) - <?2( 工）非零，贝 U 我们有 deg((q { ~ q 2 )*v) = deg(q { - q 2 ) + deg( v) 
^ deg ( v ) > deg ( r 2 - r !)， 矛盾；因此 g 1 ( j ：)- g 2 (^) = 0 J & r 1 ( x ) = r 2 ( x) 0 

下列算法实际上同多精度除法算法 4.3. ID 相同，但不涉及任何进位。 它吋以 
用来确定 g ( x ) 和 r ( x ) \ 

算法 D ( —个域上的多项式 除法）给定一个域 S 上的多项式 

u (x) ~ u m x m + ■■■ + U^x + Uq , v(x) = v n x n + •** + I；〗：C 十 7^0 

其中％关0 ,且这一算法求域 S 上的满足 （1) 的多项式 

q ( x ) - q m _ n x m ~ v + •■- + q Q ， r { x ) = r n _ x x n ~ X + ■** + r 0 

D 1 . [对々进行迭代]对々 = m _ 72 ， m _ n _ 1 ,…， 0 ， 执行步骤 D 2 ;然后此算 

法以 （ — 1，…， r 0 ) — ( - !，…， w 0 ) 终止。 

D 2. [除法循环]对于= n + A _ 1 ， n +々 - 2，…，々，置％ —，而后置 

u } <~ u } - q k v 〕_ k0 (后一操作相当于用次数小于77 +々的一个多项式 

w ( x ) - 代替 W (: r )。） I 

算法 D 的一个例子见 （5) 的下边。算术运算的次数实际上同 n(m - n + l ) 成 
比例。注意，系数的显式除法仅仅在步骤 D2 的开始处进行，而且除数总是％;所 

以，如果 w (: r ) 是首一多项式 （ z ;„ = l )， 则全然没有真正的除法。如果乘法比除法易 

于进行，则宜于在本算法开始时，计算1/%，并在步骤 D2 中乘以这个量。 

我们通常以 u ( x ) mod z ; (: r ) 代替 （1) 中的余式 r (: r )。 

惟一因子分解整环 如果我们限于考虑一个域上的多项式，则将不能直接处理 
许多重要的情况，例如整系数的多项式，或若干变量的多项式。因此现在让我们考 
虑更一般的情况，即系数的代数系统5 是惟一因子分解整环 ，这个整环不必是一个 
域。这意味着 S 是有么元的可交换环，而且 

0 每当〃和 r 都是 S 的非零元素时 

ii ) S 的每一非零元素 w 或者是一 个单位 ，或者有作 为素元 p { , , p t 的乘积的 

“惟一”表示 


u = Pd ， 


t > i 


• 383 




( 2 ) 


第 4 章算术 


这里，单位是有 一 个倒数的兀素，即对于 S 中的某个 w 使得 uv = l 的一个元素 w ;而 
一 个素元则是一个非单位的元素，它使得仅当 g 或厂之一是单位时，/> = 可为 
真。如果 /v ••九= w . g .、. ，其中所有和 <7都是素元，贝 1 j 5 =〖，而且有 U ，…， H 的 

一 个排列〜…〜，使得对某些单位 a x ，…、 a t ， p x = a 、 q n ，…，九=在这个意义 

1 f 

下，表 7 K (2) 是惟一的。换言之，除了有一些单位和因子的次序不同外，分解成素元 
是惟 一 的。 

— 任何域都是惟一因子分解整环，其中每个非零元素都是一个单位，而且没有素 
元。整数构成一个惟一因子分解整环，其中单位是+ 1和 -1， 素元是±2, ±3, ±5, 

±7,…。 S 是所有整数的集合这一情况具有决定性的重要意义，因为以整数来进行 
工作通常比用任何有理系数都更为可取。 

关于多项式的关键事实之一（见习题 10) 是: 一 个惟 一 因子分解整环上的多项 
式形成一个惟一的因子分解整环 。在这个整环中是素元的一个多项式通常称做不 
可约多项式。通过反复使用惟一因子分解定理，我们可以证明，整数环上或者在任 
何域上的任意个变量的多项式，都可以惟一地分解成不可约多项式。例如，在整数 

环上的多变量多项式 90 x 3 - I 20 x 2 y + 18 x 2 yz ~24 jry 2 z 是五个不可约多项式的乘 

积 （3 ：r - 4： y ) ° (5 x + 乂）。同样的多项式，作为有理数域上的多项式，是三个 
不可约多项式的乘积 （6 i ).(3 :r -4^)*(5 x +，）；这个因子分解也可以写成： r . 

(90 x - 120 : vO . ^十而且还有无穷的其它形式，尽管这个因子分解实质上是 
惟一的。 

和通常一样，如果，其中 g ( x ) 是某个多项式，则我们说， 
“（1) 是 Wi ) 的一个倍式，同时 t /( x ) 是 w ( x ) 的一个除式。如果我们有一个算法， 
对于一个惟一因子分解整环 S 的任意非零元素“和 T ；， 能告知 W 是否的倍元素， 
而且如果“ 功，则确定 w ，那么算法 D 就给了我们一个方法，对于 s 上的任意多 
项式 wO ) 和 r ( x )， 它告知我们是否为 u (: c ) 的倍式。因为如果 w ( x ) 是 
dO ) 的一个倍式，容易看出，每次我们达到步骤 D 2 时 ， S + A 必定是％的一个倍式， 

因此将找到商 “（: r )/ t ；( x )。 递归地应用这一发现，我们就得到一个算法，它判定 S 

上的一个任意多个变量的给定多项式，是否是 S 上另一个给定的多项式的倍式，而 
且当存在时就把商找出来。 

夸一个惟一因子分解整环中，如果没有素元能同时整除其中的一组元素，就称 
这组元素是互素的。如果一个惟一因子分解整环上的一个多项式的系数互素，就称 
该多项式为本原的。（这个概念不应同 3.2.2 小节中讨论的十分不同的“模 > 本原 

多项式”的概念相混淆。）下列事实具有基本的重要性，它是由 C . F . Gauss 在他的名 
YfDisquisitiones Arithmetics ( Leipzig : 1801) 的论文42中为了研究整数的多项式而 
引 进的： 

引理 G (高斯引理） 一 个惟一因子分解整环上的本原多项式的乘积是本原的。 

证明设 w (: r ) = u m x m +…+“ 0 和 v ( oc ) = v n x ,} 十…+ 是本原多项式 c 如 
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果声是此整环的任意素元，我们必须证明 p 不能整除乘积的所有系数。 
由假定，有一个下标 ； 使得~ 不为 P 所整除，还有一个下标々使得％不为^所整 

除。取 j 和々尽可能小，则在 WxbU ) 中的系数是 

UjVk + u J + l v k . { + ••- + u J + k v 0 + Uj. { v k + 1 + ••* + u 0 v k + J 

并且容易看出这不是 /) 的倍数（因为它的首项不是，而所有其它项都是 h I 


如果在惟一因子分解整环 S 上的一个非零多项式不是本原的，则我们可以写 

是整除 W (: C ) 的所有系数的 S 的素兀，是 S 上 

的另一个非零多项式。(: r ) 的所有系数比的相应系数少一个素因子。现在 

如果 A (: T ) 不是本原的，则我们可以写 & U ) = p 2 1 2 (^；)， 等等，而且这一过程必 

定以一个表示 W ： T ) = C * 而最后终止，其中 C 是 S 的一个元素，而且 2^(1) 是 


本原的。事实上，我们有下列引理作为引理 G 的补充。 


引理 H 一 个惟一因子分解整环 S 上的任何非零多项式 liU ) 均可分解成形式 

U(X) = C * vU ), 其中 C 在 S 中而且 v ( x ) 是本原的。而且，在下列意义下，这个表示 
是惟一的，即如果 U = CiVi ( x ) = C 2 V 2 (x) = ac 2 , v 2 ( x ) = avy ( x ) ，其中 a 是 S 

的一个单位元素。 

证明我们已经证明了这样一个表示存在，因此这里只须证它的惟一性。假定 
Q • 〜（^ ) = C 2 • ) ，其中( X )和^ ) 是本原的。设/>是 S 的任何素元，如果 

P k 整除^，则 〆 也整除 C 2; 否则 〆 将整除勹1 2 (工）的所有系数，所以将整除 

hU ) 的所有系数，矛盾。类似地，//整除勹仅当/整除 Cl 。 因此，由惟一因子分 
解， c ' = ac2 ，其中 a 是 一 ^个单位兀；而且0= ac2 ( x )~ C2V 2 { oc ) = c 2 ( av ^ ( x ) ~ 

幻 2 (工 ）） ，所以 a % (:r ) — i ； 2 ( 工 ）= 0。 ! 


因此我们可以把任何非零多项式 〃（:0写成 

u ( x ) = cont ( w ) • pp ( u ( x )) (3) 

其中03价（“），即 《 的容度 ，是 S 的一个元素 ，而 pp ( W (： T ))， 即 以: r ) 的本原部分， 
是 S 上的一个本原多项式。当 u ( x ) = 0时，定义 cont ( u ) = pp ( w (: r )) = 0是很方 
便的。把引理 G 和 H 结合在一起，就给岀了关系式 

cont ( u • v ) — a cont ( u ) cont ( v ) 

pp ( u ( x ) • v ( x )) = ^ pp ( w ( x )) pp ( t ;(^)) (4) 

其中 a 和 6 是单位，它们取决于容度被计算的方法而且 ab = l 。 当我们对整数上的 
多项式进行处理时，仅有的单位元素是+ 1和-1，因此定义 pp “ U )) 使得它的前 
导系数为正是方便的。于是 (4) 对于 a = 6 = 1为真。当处理一个域上的多项式时， 

我们可以取(： 0 1^(^) = /“），使得？9(^(：0)是首一的 ； 在这种情况下，对于所有的 
w (: r ) 和 ， （4) 再次对于 a - b - \ 成立。 

例如，如果我们处理整数上的多项式，设 二 -26/ + 39, =21 x + 

14,则 
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cont ( u ) = - 13 , pp ( u ( x )) = 2 x 2 - 3 

cont ( v ) = + 7 ， pp ( v ( x )) = + 2 

cont(w * v ) — - 91, pp ( u { x ) • v ( x )) = 6 jo 3 + Ax 2 - 9 x - 6 


最大公因子 当有惟一的因子分解时，就可以来谈论两个元素的 最大公因子。 
这是一个为尽可能多的素元整除的公因子（参考等式 4.5. 2-(6))。然而，由于一个 
惟一因子分解整环可以有许多单位元素，故在这个最大公因子的定义中有二义性; 
如果 xt , 是〃和 r 的最大公因子，则当 a 是单位元素时^ w 也是。反之，惟一因子 
分解的假定意味着，如果和两者都是“和 r 的最大公因子，则对于某一单位 

元素 a ， 有 rv [ ~ au)2 o 换句话说 ，一 般说来，谈论"和 r 的“某个”最大公因子是没 

有意 义的； 有一个最大公因子的集合，每一个是其它的单位倍元。 

现在让我们来考虑求一个代数系统 S 上两个给定多项式的最大公因子的问 

题，这是最初由 Pablo Nufiez 在他的 Ubro de Algebra ( Antwerp : 1567) 中提出的问 

题。如果 S 是一个域，则这个问题比较 简单； 我们的除法算法，即算法 D ， 可以被推 
广成计算最大公因子的一个算法，恰如欧几里得算法（算法 4.5.2 A ) 以一个整数的 
除法算法为基础而产生两个给定整数的最大公因子 一样： 

如果 v ( x ) = 0,则 gcd ( u { x ) , v ( x )) = u ( jo ) 

否则 gcd ( u ( x ) , v { x )) - gcd ( v ( jr ) , r { x )) 

其中 r (_ r ) 由 （1) 给出。这个过程称为一个域上的多项式欧几里得 算法； 它首先是由 

Simon Stevin 在 L f Arlthmetique ( Leiden : 1585) 中使用的;请见 A . Girard , Les CEuvres 
Mathemsttiques de Simon Stevin 1 ( Leiden : 1634) ,56。 

例如，用关于整数模 13 上的多项式的欧几里得算法，我们来确定+ x 6 + 
lCLr 4 + _ L 0： r 3 + 8： r 2 + + 8和 3 x 6 + 5： r 4 + 9： c 2 + 4 ：c + 8 模 13 的最大公因子。首先， 

仅写出系数说明算法 D 的步骤，我们有 
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0 

11 

0 

3 

0 
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(5) 


因此 

x 8 + x 6 + 10x 4 + 10x 3 + 8x 2 + 2 a: + 8 = 

(9: r 2 十 7)(3: r 6 十 5 : r 4 十 9jc 2 + 4 x + 8) 十 (11工 4 十 3jc 2 + 4) 

类似地 

3 x 6 + 5 x 4 十 9? + 4: + 8 = ( 5 x 2 + 5)( llx 4 + 3工 2 + 4) + (4: + 1) 

llx 4 + 3 x 2 + 4 = ( 6 x 3 + Sx 1 + 6 x + 5 ) {Ax + 1) + 12 (6) 

Ax 十 1 = 十 12) .12 + 0 

(这里的等号指的是模13同余，因为对于系数的所有算术都是按模13处理的。）这 
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个计算表明，12是两个最初的多项式的最大公因子。现在一个域中的任何非零元 
素都是这个域上的多项式整环中的一个单位，因此，在域的情况下，习惯上是以其前 
导系数来除这个算法的结果而产生一个首一多项式，将这个多项式称为两个给定多 
项式的最大公因子。因此 （6) 中计算的最大公因子相应地取为1，而不是12。 （6) 中 
最后的步骤已可省略，因为如果 deg ( v ) = 0，则 gcd ( u ( x ) , v ( x )) = 1，而不管你对 
W (: r ) 选择的是什么多项式。习题4确定对于模随机多项式的欧几里得算法的平 
均运行时间。 

现在我们转到更为一般的情况，其中的多项式在不是一个域的惟一因子分解整 
环上给出。从等式（4)，我们可以推导出重要的关系 

cont ( gcd ( u , v )) = a • gcd ( cont ( w ) ， cont ( w )) 

(7) 

pp ( gcd ( u ( x ) , v ( x ))) = b • gcd ( pp ( u ( x )) , pp ( v ( jc ))) 

其中 a 和 6 是单位元素。这里 gcd ( u ( 工 ） ， w (: r )) 是 x 的任何特定的多项式，是 
W (: r ) 和(: T ) 的最大公因子。等式 (7) 把求任意多项式的最大公因子的问题归结为 
求本原多项式的最大公因子的问题。 

用于一个域上的多项式除法的算法 D 可以推广成为任何代数系统上多项式的 
伪除法 ，这个代数系统是有幺元的可变换环。我们注意到算法 D 要求的只是显式地 
除以 /( zO , 即的前导系数，而步骤 D 2 要进行恰好 ^-72+1 次； 于是如果 
W ( x ) 和 Wz ) 以整系数开始，而且如果我们在有理数上进行工作，则仅仅是出现在 
g ( x ) 和 r ( i ) 中的系数的分母是/(^广1 + 1 的因子，这提示我们，总是可以求得多 
项式 g (: c ) 和 r (: r ) ，使得对于任何多项式 w ( x ) 和假定 m^n , 

i { v) m ^ n + A u { x ) = q { x ) v { x ) + r { x) y deg ( r ) < n (8) 


其中 m = deg( w ) 和” =deg( v) 0 

算法 R (多项式的伪除法） 给定多项式 

u(x) = ll m X m + + U Y X + Uq } v(x) = V n X 7> + ■* • + VyX + Vq 

其中 v ?l 9^0y 川 >77 >0,这个算法求满足 （8) 的多项式 q(x) = q rn - n x m ^ … + g 0 

和 r(x) - r n - 1 a” _ 1 十 …+ r 0 。 

R 1 »[对々进行迭代 ]% k 二 m - n , m - n _ 1，…，0，执行步骤 R 2 ，然后算法 

以 （- 1， " •，厂 0) = 1，…，“。）终止。 

R 2 •[乘法循环]置 q k — u ” + k v L ;, ，并且对于_; = 7? +々-1，?2 +々- 2，"，，0，置〜 

一 V ” U J _ ^。（当 J 〈 k 时，这意味着 Uj — V n Uj ，因为我们把一 i ， 

r _ 2 ，…当做零。如果对于 - 7?，以 V :…、代替屮开始这个算 

法，则这些乘法可以避免 。）I 

一个计算例子见于下面的（10)。通过对 w 用归纳法，容易证明算法 R 的 
■ 
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正确性。因为每次执行步骤 R 2 实质上是以(: T ) 代替 u ( x ), 
其中 A = degU )- deg ( r ;)。 注意，在这个算法中根本不用任何除法 wU ) 和 r (. r ) 
的系数本身又都是和 Wx ) 的系数的某个多项式函数。如果％ = 1，则这个算 

法等同于算法 D 。 如果 wU ) 和 ^ U ) 都是一个惟一因子分解整环上的多项式，和以 
前一样我们可以证明多项式 g ( x ) 和 r ( x ) 是惟 一的； 因此在惟一因子分解整环上进 
行伪除法的另一个方法是以 v :-” + 1 来乘 M (: r ) 并应用算法 D ， 且知道在步骤 D 2 中 

的所有商都将存在。 

用以下方法可以把算法 R 推广成为在惟一因子分解整环上本原多项式的一个 
“广义欧几里得算法 ”：设 w ( x ) 和 W ： r ) 是本原多项式且 deg ( i /)> deg ( z ;)， 并借助算 
法 R 确定满足 （8) 的多项式 rU )。 现在我们可以证明 gcd( w U )，^ U )) = 
gcd ( t ; (: r ) ， r (^ r )) : w (: r ) 和 w ) 的任何公因子都整除 w (: c ) 和 t ； (: c ); 反之， z ; ( x ) 
和 r ( x ) 的任何公因子都整除 + 而且它必定是本原的（因为 t ；( x ) 

是本原的），所以它整除 u ( sc )。 如果 r ( x ) 二 0,我们因此有 gcd ( w (^;),^( x )) = 

wU ); 另一方面，如果厂（工）参0，我们有 § (^(^;(: ? :)，「（：0)= § 。 ( 1(^;(：0，口口（厂 

(: c ))) ，因为 z ;( x ) 是本原的，所以这个过程可以被迭代。 

算法 E (广 义欧几里得算法） 给定在一个惟一因子分解整环 S 上 的非零多项式 

wU ) 和 Wa ：)， 本算法计算 w (： r ) 和 t ；0) 的最大公因子。我们假定存在一些辅助算 

法，以计算 S 的元素的最大公因子，而且当 b ¥-0 及 a 是6的一个倍数时，在 S 中以6 
除 a 。 

El . [归结为本原的]置 ^^ gcd ( cont ( u ) , cont ( )) ,使用假定的计算 S 中的 
最大公因子的算法（由定义 cont ( u ) 是的系数的最大公因子）。以多 
项式“ x )/ cont ( w ) = pp ( 1〆 x )) 代替 w ( J ：) ;类似地，以 pp ( t ; (: c )) 来代替 

v ( x ) a 

E 2 •[伪除法]利用算法 R 计算 r ( x )( 没有必要计算商多项式 qU ))。 如果 

r ( x ) =0,则转到 E 4。 如果 deg (0 =0,则以常数多项式“1”代替 v ( sc ) 并转 
到 E 4 。 

E 3 •[使得余式成为本原的]以代替 w (: c )， 并以 pp ( r (: c )) 代替 v ( x ) 0 

转回步骤 E 2。 （这是“欧几里得步骤”，类似于我们已经看到的其它情况下 
的欧几里得算法。） 

E 4 •[配上容度]此算法终止，且以 iWa ：) 作为所求答案。 ■ 

作为算法 E 的一个例子，我们来计算整系数多项式 


u ( x ) — : c 8 + x 6 - 3 x 4 - 3 x 3 + 8 x 2 + 2 x - 5 

v ( x ) = 3 x 6 + 5 x 4 - 4 x 2 - 9 x + 21 


(9) 


的最大公因子。这些多项式是本原的，所以步骤 El 置 d —1。 在步骤 E 2 中，我们有 
伪除法 
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10 -6 

3 0 5 0 -4 -9 21 )~1 ~~0 1 ~ 0-3-3 82 ^5 

3 0 3 0 -9 -9 24 6 - 15 

3 0 50-4 - 9 21 _ 

0 — 2 0 ■ 5 0 3 6 — 15 

0 - 6 0 - 15 0 9 18 -45 (10) 


0 0 

0 0 

0 

0 

0 

0 

_ 6 

0-15 

0 

9 

18 

-45 

-18 

0-45 

0 

27 

54 

-135 

一 18 

0-30 

0 

24 

54 

- 126 


-15 

0 

3 

0 

-9 


这里商 gU ) 是 ( — 6).3° ;我们有 

21 u { x ) = v { x ){ 9 x 2 - 6) + (— 15^ 4 + 3 x 2 — 9) (11) 

现在步骤 E 3 以 r ( x ) 代替 w (: r ) 和以 pp ( r (: c )) = 5 x 4- ： f 2 十3代替 v ( x ) 0 下表概 
述了后续的计算，其中仅示出系数 



1，0，1，0， _ 3， _ 3,8,2， _ 5 3,0,5,0, - 4， - 9,21 

3,0,5,0, -4, -9,21 5,0, -1,0,3 

5,0, -1,0,3 13,25, -49 

13,25, -49 4663, -6150 


-15,0,3,0, ~ 9 
- 585, - 1125,2205 
- 233150,307500 

143193869 



通过使用本小节早先所述的域上多项式的欧几里得算法，把这个计算同 有理数 
上而不是整数上的同一个最大公因子的计算加以比较是有教益的。出现了下边的 
惊人复杂的序列： 


a ( x ) 

1，0，1，0， — 3, — 3, 8, 2, — 5 

3, 0, 5, 0, - 4, — 9, 21 

5 1 

-— 0 — 0 
9， ，9，， 

117 „ 441 

-五， _9 , "25" 

233150 102500 




3, 0, 5, 0，-4，-9, 21 

5 1 1 

-— 0 — 0 - — 
9， u ， 9 ， ， 3 


117 

441 

Q m 

，25 

25 ’ 

233150 

102500 

19773 5 

6591 


1288744821 

543589225 



19773 ’ 6591 
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为了改进该算法，我们可以在每步把〃（: T ) 和 WU ) 约化成首一多项式，因为这 
就消去了使得系数不必要地复杂化的“单位” 因子； 这实际上就是有理数上的算法 
E ： 



1，0，1，0，- 3,- 


3，8，2， — 5 





6150 

4663 


(14) 


_6150 1 

， 4663 

在 （13) 和 （14) 两者当中，多项式序列实际上和 （12) — 样，它是通过整数上的算 
法 E 得 到的； 惟一的差别是这些多项式已经乘以某些有理数。不论我们有 5 x 4 - x 2 

十 3 ，还是-吾/ + +：^-+，还是 x 4 -+ 实质上计算都是相同的。但使用 

有理数算术的任一个算法，倾向于比全整数的算法 E 要慢一些，因为有理算术在多 
项式有很大的次数时，要求在每一步内做更多的整数 gcd 计算。 

把（12)， （13) 和 （14) 同上边的 （6) 加以比较也是有教益的，在那里我们以相当少 
的工作量就确定了同样的模13多项式 wU ) 和 wU ) 的 gcd 。 由于 / U ) 和 / ( r ) 都 
不是13的倍数，故 gcd ( u ( x ) y v ( x )) — 1( 模 13) 这 一 '事实已足以证明和 
在整数上互素（因而在有理数上也如此）；在 4.6.2 小节的结尾，我们将回过头来考 

虑节省时间的问题。 

子结式算法 George E . Col ! insL/ACM 14 (1967) ，128〜142 ] 发现了一般地说 

比算法 E 更为优越，并提供了关于算法 E 的特性的更进一步信息的一个巧妙算法。 
随后又由 W . S . Brown 和 J . F . Traub [JACM 18 ( 1971 ) ，505〜514;也见 W . S . 

Brown, ACM Trans . Math . Software 4 (1978)，237 〜 249 ] 对它做 了改进。这 一 算法 

避免了步骤 E 3 中本原部分的计算，代之以用 S 的一个元素来除，而这个元素已知 
为 r (: r ) 的一个因子。 

算法 C (一个惟一因子分解整环上的最大公因子） 这个算法有和算法 E —样 
的输入和输出假定，而且有一个优点，就是所需要的关于系数最大公因子的计算较 

少。 

C 1 •[归结为本原的]如同算法 E 的步骤 E 1 中那样，置 d — gcd (cont ( w ) ， 

cont ( p )) ，并以 （ pp ( w ( j : ))， pp ( wO ))) 代替 （ u ( x ) y v ( x )) o fi g ^- h^lo 
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C 2 •[伪除法]置 deg ( w ) - deg ( v ) 0 用算法 R 计算 r (: r)。 如果 r(x) = 
0,则转到 C4。 如果 deg(r) = 0, 则以常数“1”代替 rU)， 并转到 C4。 

C 3 •[调整余式]以 uU) 代替多项式 《U)， 以 r ( x ) lgh s 代替（这时 

r (: r) 的所有系数都是砂 5 的倍数。）然后置 H u ) , h — h [ " 8 g s 并返回 
C 2 0 (即使的新值仍将在整环 S 内。） 

C 4 •[配上容度]返回心 p P ( W ： r )) 作为答案。 ■ 

如果我们把这一算法应用于早先考虑的多项式（9)，则在步骤 C2 的开始处得到 
下列结果序列： 


1，0，1，0, - 3 , ~3,8,2, - 5 

3,0,5,0, — 4, - 9,21 

-15,0,3,0, -9 


v ( x ) g h 

3,0,5,0, — 4, — 9,21 1 1 

-15,0,3,0, -9 3 9 

65,125,-245 - 15 25 



65,125, -245 - 9326,12300 65 169 

在此算法结束后， r“）/^ d ' = 260708。 

这个多项式序列是由算法 E 产生的序列中多项式的整数倍组成的。尽管多项 

式未约化成本原形式，但这些系数总保持适当的大小，这是因为步骤 C3 中有一个约 
化因子所致。 

为了分析算法 C， 并证明它是正确的，让我们把它产生的多项式序列叫做 

“〆：?：），“ 2(:)，以3(:)，…，其中““工）：〆：?：）和 U 2 ( x ) = I；(x)o 设对于 

= ' - 1 ，其中〜= deg( 〜）；并设对于 j>2,g 1 = £( Uj ) y hj = 

于是我们有 


Si 1 

+ l u { (x)= 

it 2 (oo)q { (x) ^ 


^3 

< 

/? 2 


g\ 2 

+ l U 2 (x )= 

u 3 (x)q 2 (jo) H 

卜 g2" 孚以 4(Z) ， 

n 4 

< 

”3 

(16) 


+ [ u 3 (x )= 

u 4 (x) q 3 (x) H 

卜 g^h S ^u s {x) , 

«5 

< 

n 4 



等等。当 W + ] = deg( w + i X0 时此过程终止。我们必须证明 w 3 (:r)，w 4 (i)， …的 
系数都在 S 中，即诸因子完全整除诸余式的系数，而且我们还必须证明诸\ 

的值全都属于 S。 证明相当棘手，但通过一个例子很容易理解。 

如同在 （15) 中那样，假设 

^2 = = s 5 = lo 让我们写 ^(：2：) = “ 8 1 8 +。 7 ：?： 7 + … + aQ，W2(：r) = Z? 6 J： 6 + 

b 5^ 5 + …+ 〜，…， W 5 (x) = q：r + a， “ 6 ( ： c) = / 0 ,使得 h = 1， /i 2 = /：)■， A 3 二 C 2 J bi ， 
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h 


4 


d\b\\c\ 


在这些项之下，考虑表1中所示数组是有帮助的 


O 


为具体起见，我们 


假设多项式的系数都是整数。我们有(: h (:(: T)+ &(工）；所以如果 
我们以 M 乘行 a 5 ，并且减去行 B 7 ，B 6 和 B 5 的适当倍（对应于的系数），则我 

们将得到行 c 5 。 如果我们以以乘行 a 4 ，并减去行 s 6 ， b 5 和 b 4 的倍数，就得到行 


C 


类似地，我们有 c 4 3 Ui { x ) = x ) q 2( 工 



blu^i 


X 


; 所以我们可以 



乘行 


B 3 ，减去行 C 5 ，C 4 和 C 3 的整数倍再除以 M 而得到行 D 


表1 


算法 C 中的系数 


行名 




乘以 


代之以行 




b \ 


In 


U 

U 

u 


“7 


^5 

^4 

^3 

0 

0 

0 

0 


0-1 



^4 

0 

0 

0 

0 

0 

as 

«7 

^6 

^5 

心 6 

bs 

6 4 

心 3 

bi 


^0 

0 

0 

0 


bs 

b , 

by 

厶 2 

b \ 


0 

0 

0 

厶 6 

厶 5 

bi 

心 3 

厶 2 

b ' 

厶。 

0 

0 

0 

厶 6 

厶 5 

6 4 

厶 3 

厶 2 

厶 1 

0 

0 

0 

0 

心 6 

bs 

b . 


厶 2 

0 

0 

0 

0 

0 

心 6 

bs 

b . 

厶 3 


^2 a 1 a 0 


^3 a 2 


^ d ^3 a 2 a 1 


hi 


6 6 b 5 


6 0 0 0 0 

h } b Q 0 0 

厶 2 厶 1 ^0 0 

63 b 2 b x b 0 


厶 6 办 5 厶 4 


△2 b \ 


cilbl 

cilbl 

c]l bl 

cil bl 


c 4 



Cl c t C (3 



〔2 



( : 0 


C 4 



〔2 



CQ 




^2 



〔0 


[4 c 2 c 2 c 1 


U 

U 

U 

c*4 

^3 

Cl 


fo 

0 

0 

d 2 

d ] 

^0 

0 

0 

0 

0 

0 

0 

d 2 

d\ 

<^0 

0 

0 

0 

0 

0 

0 

^2 

d\ 

d{s 

0 

0 

0 

0 

0 

0 

d 2 

d. 

d. 

0 

0 

0 

0 

0 

^1 

^0 

0 

0 

0 

0 

0 

0 

0 

ei 


0 

0 

0 

0 

0 

0 

0 

fo 


dlbll cl 
dlbtlcl 


e \ c \\ d \ b \ 


为了证明 W4 (X) 有整系数，让我们考虑矩阵 
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^2 

^ l 

^0 

B 4 

B , 

Bo 


a 8 

0 

0 

be 

0 

0 

0 

0 


a 7 

a 6 

^5 

CL 4 


a 2 

^1 

a 0 

u 

“8 

a i 

^6 

Cl 5 

CL 4 

a 3 

a 2 

ai 

^0 

0 

a 8 

a 7 


^5 

a 4 

a 3 


^1 

^5 

^4 

/)3 

bi 

b\ 

bo 

0 

0 

0 


0 

0 


a 


bt 

0 

0 

0 


心 5 

be 

0 

0 


心 4 

bs 

h 

0 


^3 

b , 

bs 

be 


^2 

^3 

6 4 

bs 


b \ 

b 2 

△3 

tu 


^0 

b \ 

bi 

6 3 


0 

bo 

b \ 

bi 


0 

0 

bo 

b \ 


0 

0 

0 

0 


M 


(17) 



所指出的行操作和各行的一个重新排列，将把 M 变换成 


B 4 


b 


bs 


b 4 


b 


b . 


bi 


^0 


0 


0 


0 


B 3 

0 

s 

bb 

b 5 

^4 

厶 3 

^2 

b\ 

bo 

0 

0 

b 2 

0 

0 

be 

b 5 

^4 

63 

t >2 


bo 

0 


0 

0 

0 

be 

b 5 

^4 

^3 

bi 

b\ 

bo 

c 2 

0 

0 

0 

0 

C4 

^•3 

Cl 

c\ 

^0 

0 

C) 

0 

0 

0 

0 

0 

c 4 

C3 

Cl 



C 0 

0 

0 

0 

0 

0 

0 

^4 

c-i 

Cl 

Cl 

D 0 

、0 

0 

0 

0 

0 

0 

0 

0 

d ，2 

d j 


0 

0 

0 

0 

0 

0 


M / 


(18) 


do 


由于从 M 导出 AT 的方式，如果 Mo 和表示通过选择 M 和 iVT 中的 8 个相应的 
列而得到的任何正方矩阵，我们必有 


b 


b 


h 


: 4/ ^1) 


derM 


士 detiVT 


例如，我们选择头 7 列以及包含 A 的一列，则 


^8 

0 

0 


bl 




bl 


m 


b \ 


_ 


( C4I b 


det 




0 0 b 6 b 5 b 4 b 3 b 2 

0 0 0 6 6 b 5 63 

、 0 0 0 0 b 6 b 5 b 4 

由于乒0,这证明了 A 是 整数； 类似地 ， d 2 和 & 是整数 


a l 

^6 

^5 

a 4 

a 3 

a 2 

as 

a l 



CL 4 

^3 

0 

a 8 

a 7 

a 6 

a 5 

CL 4 

bs 


63 

bi 

by 

bo 

^6 

bs 

厶 4 

厶 3 

bi 

b[ 

0 

be 

bs 

^4 

^3 

b 2 

0 

0 

办 6 


厶 4 

^3 

w 

0 

0 

0 

be 

b, 

^4 


0 




a 



0 

0 




± b \ 


• c 4 


d 



b 


般地说，我们可以类似方式证明 ~ 


: r ) 有整系数。如果从由行 A 


到 A 


) 


和由 B 


到馬所组成的矩阵 M 开始，而且实施表 


中指出的行操作，则我们将 


得到一个由行 B 


Qo , 最后是尺 o ( 包含义 


.到 B fl ^ r]j + l ,'到 …， 到心 ， Q Vi —〜到 

心 + 1 (: T ) 的系数的一行）以某种顺序组成的矩阵 M \ 抽取适当 


)的系数的一行）以某种顺序组成的矩阵 AT 
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的列示出 

土 心―'"^ 2 ” 14 … A 厂〜 《？ _1 — 〜 I ( 19 ) 

其中 r , 是士 + 1 U) 的一个给定系数，而 M Q 是 M 的一个子矩阵。诸 A 已经非常巧 
妙地被选定使得这个等式简化为 

detM 0 = ± r L (20) 

(见习题24)。因此 a + 1 U ) 的每一系数都可表达为其元素为 u ( x ) 和 vU ) 的系数 
的 一 个 （n ^ + ? 7 2 ~ 2 n } + 2) X (^ 1 + n 2 ~ 2 n } + 2 ) 矩阵的行列式。 

剩下要证明的是巧妙地选择的诸 A 也是整数。可应用类似的技术 ：例如 ，观察 

矩阵 

A j ag a ^ 0-4 a 3 a 2 a 1 a o 0 

Aq 0 a § CLl ^6 a 5 a 4 a 3 a 2 a 1 a o 

B 3 b 6 b 5 b 4 b 3 b 2 b { 6 0 0 0 0 

B 2 0 b 6 b 5 b A b 3 b 2 b x b 0 0 0 

B [ 0 0 b 5 1)4 63 bi b \ bo 0 

B 0 ^ 0 0 0 b 6 b 5 b 4 b 3 b 2 b x b 0 

如表 1 中所确定的那样的行操作以及行的重新排列导致 

B 3 ^6 ^5 ^4 ^3 b 2 b \ b Q Q 0 0 

Bo 0 b 6 b 5 b 4 63 b 2 bi bo 0 0 

B j 0 0 b 5 b 4 63 bi b \ 0 

B 0 0 0 0 6 6 65 b 4 6 2 h x 6 0 

C L 0 0 0 0 C 4 C3 C 2 Cy Cq 0 

C 0 、 0 0 0 0 0 C A C'2 c 2 c { Cq 

因此，如果考虑通过选择 M 和 AT 的6个对应列所得到的任何子矩阵 M c 和 M(； ，则 
我们有 b\ * detM 0 = ± detMo 0 当把 M。 选择成为 M 的头6个列时，我们发现 
detMo = 土 c 》 l ± "3 ,所以々 3是—个整数。 

一 般地说，为证明对于 j > 3 f h J 是一个整数，我们从由行 A 7 , 1 ^到 Ao, 及 

^ ) 

B r , 1 所组成的矩阵 M 开始； 然后实施适当的行操作直到得到一个由行 

1 J 

氏 — 叫到氏 ， C „ +” — 丨到 C ” ，…， P ” —】到 Po.Qn -iS'J Qo 的矩阵 

1 ; 3 ; 2 j 4 ； J-2 J J - \ J 

」VT 。命 Mq 是 M 的头? 2 jl + n 2 _ 2义列，我们得到 

(g2 l + l l g^^) n 2- n j( g y i l g 2 hi2) n r n r-(g S y-^ + [ l g J ^ l h 8 j ： \) n r ,, jdetM 0 = 

土 沙” v"4_ Y — 〜心一 】-' (23) 

这个等式可干净利落地简化为 
• 394 • 
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detMo = ± (24) 

(这个证明尽管是对于整数环论述的，但明显地可应用于任何惟一因子分解整环。） 

在验证算法 C 的过程中，我们也已经知道，由此算法所涉及的 S 的每个元素都 

可表达成为一个行列式，这行列式的元素是原来多项式的本原部分的系数。 Hada - 
mard (阿达马）的著名定理（见习题 15) 指出 



因此如果给定的多项式 w (: r ) 和 Wx ) 的所有系数在绝对值上都以 A / 为界，则在由 
算法 C 计算的多项式中出现的每个系数至多是 


N ,,, + n (m + 1) 7,12 (?2 + 1 ) " 12 (26) 

这同一上界可应用于在执行算法 E 期间计算的所有多项式 〃（: r ) 和 t ; (: r ) 的系数 
上，因为在算法 E 中得到的诸多项式总是算法 C 中得到的多项式的因子。 

关于系数的这一上界是极其令人满意的，因为它比起我们所能期望的要好得 
多。例如，设想如果我们在步骤 E 3 和 C 3 中不作校正，仅用 rU ) 代替 I ；(: r ) 会发生 
什么情况。这是最简单的 gcd 算法，而且它是传统地出现于代数教科书（用于理论 
目的，而不打算用于实际计算）中的一个算法。如果假设心=& =…=1，我们发现 

的系数以 N 3 为界，〜（工）的系数以 iV 7 为界， “ 5 U ) 的系数以 TV 17 为界 ，…; 


wU ) 的系数以 W 为界，其中 auo 于是，当 m 二72十1时，上界将不 
是（26)，而近似地是 


- 5(2.414) (27) 

而且经验证明，这个简单的算法事实上确有这个 特性； 在每步中系数中的位数都按 
指数增长！相反，在算法 E 中，位数的增长顶多只比线性增长多一点。 

我们对算法 C 进行的证明的另一个副产品是，多项式的次数在每步将几乎总是 
减1，使得如果给定的多项式是“随机的”，步骤 C 2( 或 E 2) 的迭代次数将总是 
deg(t ；)。 为了看看这为什么会发生，例如，注意在 （17) 和 （18) 中我们可选择 Af 和 


iVT 的头8列，然后我们发现当且仅当 A 二0,即当且仅当 



^8 

<2 7 

^6 

^5 

a 4 

^3 

a 2 


T 

' 

0 


^7 

a 6 

a 5 

“4 

^3 

ao 

I 

0 

0 

^8 


a. 6 

^5 


a 3 

det 

^6 


^4 

63 

bi 


bo 

0 

0 

be 

^5 

心 4 

办 3 

hi 

bi 

bo 


0 0 b 6 b 5 b A b 3 b 2 b { 

0 0 0 心 6 ^5 b 4 63 bi 

, 0 0 0 0 ^6 bs b 4 



时， 〜（： r ) 的次数小于3。 一 般来说，对于 7 >1，当且仅当在 w (: c ) 和 p (: r ) 的系数中 


一个类似的行列式为0时，&将大于1。由于这样一个行列式是在这些系数中的非 
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零的多变量多项式，因此它“几乎总是”或“概率为广’地非零的（关于这个命题的更 
精确的表述，见习题16,关于有关的证明见习题4)。在 （15) 的多项式例子中，心和 


^3都等于2，所以它们确实是例外的。 

上述的考虑可用来推导有名的事实，即两个多项式互素当且仅当它们的结式非 
零。结式是有表1中的行 A 5 到 A Q 及到 Bo 的形式的行列式。（这是 “Sylvester 


行列式”；见习题12。 B . L . van der Waerden 讨论了结式进一步的性质，见 Modern 
Algebra ， Fred Blum 译 （New York : Ungar ，1949) ，第 27 〜 28 节。）从上边讨论的观 

点，我们可以说， gcd “几乎总是”零次的，因为 Sylvester 结式几乎从不为零。但是如 
果没有相当的机会使 gcd 是一个正次数多项式的话，许多有实用意义的计算就不会 
进行了。 


通过考虑 u ( x ) = u )( x ) u \ v ( x ) ~ 其中 


u 


⑴和 


U2\0C 


互素且 W (: T ) 是本原的，我们可以精确地看到，在算法 E 和 C 执行期间，当 gcd 不是 
1时会发生什么情况。当算法 E 对和 V ( x ) = W 2 (：C ) 进行工作时，如 


果得到多项式 w i 2 ) ， " 2 (:r ) ， w 3 (:r ) ， … ，则容易证明，对于 u ( x ) = vu ( x ) 
v { x ) — w (: c ) w 2 (: r )， 所得到的序列只不过是 zv ( jc ) u { ( jc ) y vu ( x ) u 2 ( jc ), w ( x ) ' 
w 3 ( x )， w ( x ) w 4 (: r )， 等等。对于算法 C ， 特性与此不同 ：如果 当算法 C 应用于 
u ( x ) = w (: r )= w 2 (: c ) 时，得到多项式 …， 而且如 

果我们假定 deg (义 + 1 )二 deg (义 ）-1( 当 j > 1 时它几乎总是真的），则当算法 C 应用 

于 u { x ) ~ vu { x ) U { ( x)^L v ( x ) = ( X ) W 2 ( ) 时，得到序歹 1 J 

w ( x ) U i ( x ) , w { x ) U2 ( jc ) , i 2 w { x ) U2 >{ x ) ,£ 4 , w ( x ) U A ( x ) y w ( x ) U 5 ( jc ) y mmm 


(28) 

其中彳 = ^( u ；)( 见习题 13)。 尽管存在另外的 / 因子，算法 C 还将是优越于算法 E 
的，因为比起重复地计算本原部分来，倒不如处理稍微大一些的多项式更容易些。 

诸如在算法 C 和 E 中那样的多项式余式序列不仅仅对求最大公因子 有用； 另一 

个重要的应用是按照 J . Sturm 的著名定理 [ Mem . Presentes par Di vers Savants 6 

( Paris ，1835),271 〜 318]， 对于一个给定的区间内的一个给定的多项式枚举实根的 
个数。设〃（: r ) 是实数上的一个多项式，具有不同的复根。我们将在下节看到，根是 
不同的当且仅当 gcd ( w (: r ) ， / (:?:)) = 1，其中 z /( x ) 是 w (: c ) 的导数；因此，有一个 
多项式余式序列证明 w (: r ) 与 /(- r ) 互素。置 ~ u ( jc ), u { ( x )~ i /(: r )， 而且 

(遵照 Sturm 定理）我们把所有余式的符号取反，对某些正常数 q 和&得到 

c L w 0 (x ) = u ^( x ) q i ( x ) - diu 2 ( jc ) 

c 2 u x ( x ) = u 2 ( x ) q 2 ( x ) - 工、 (29) 


其中 deg ( u k + 


Cf,U-i，- j ( 32 

0。我们说在 u 


= u k {x)q k (x) - d k u k + x (x) 

处 M (: r ) 的变差 V ( w ， a ) 是序列 u 0 (a), u 


(a) ， • 



W + 1 ( a ) 中符号变化的个数，不计0。例如，如果符号序列是0, +，_，_，0, +， 
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+， _ ，我们有 V ( u , a ) = 3 0 Sturm 定理断言，在区间中， u ( x ) 的根的个 
数为 VU ， a )_ 其证明惊人地短（见习题 22)。 

尽管算法 C 和 E 是有趣的，但它们不是惟一的方法。 4.6.2 小节末尾讨论了在 
整数上计算多项式 gcd 另一些重要的方法。也有一个一般的计算行列式的算法，它 
可以说是把算法 C 作为 一 个特殊情况；见 E . H . Bareiss , Math . Comp. 22( 1968 ) , 565 
〜 578。 

f 在本书的第 4 版中我计划重写本小节的剖析，把19世纪关于行列式的研 

究，以及 W. Habicht 的著作， Co 7 wm , Mad 21 (1948) ， 99 〜 116考虑在内。 

对于后者的 一* 个精彩的讨论已经由 R . Loos 在 Cbmputing，Supplement 4 ( 1982 ),115 
〜137中给出。 C . L . Dodgson(aka Lewis Carroll ) 从雅可比的一个定理出发导出的用 

于计算行列式的一个有趣的方法，也同这些方法高度有关。有关子矩阵的行列式之 

间的恒 等式早期历史的概述，也请参见 D . E . Knuth..Electronic J . Combinatorics 3,2 
(1996)， 文章 R 5, §3。 


习题 

1. [ JO ] 当 u ( x ) = jo 6 + x 5 — x 11 + 2： r 3 + 3: c 2 — 工 + 2和 v { x ) — 2 x ^^2 x 1 - x + 3在整数上时， 
计算伪商9(工）和伪余式即满足 （8) 的多项式。 

2. [ 15 ] 在模7下， + + 十 4 a ： 3 十3工 2 十4 1 2：十2和它的“反序”2 1 2： 6 + 4工 5 + 3 > 3： 4 + 4：?： 3 

+ Ax 1 + a - + 3的最大公因子是什么？ 

► 3.[ M 25] 证明一个域 S 上的多项式的欧几里得算法可被扩充来求 S 上的多项式 L / U )， 
VU )， 使得（参考算法 4.5.2 X ) 

u ( x ) V { x ) + U(jc)v(x) = gcd ( ii ( x ) , v ( x )) 

由这个扩充的算法计算的多项式 UU ) 和 VU ) 的次数是多少？证明如果 S 是有理数域，而且 
W (. r ) =，- 1和 rU ) 二/-1，则扩充的算法产生整系数的多项式 L /(： r ) 和 VU )。 当 u ( x ) = 
jc 21 - 1，1(:) = : 13_ 1 时，求 （7( 工)和 V (: c )。 

► 4.[ M 30] 设为素数，并假设把欧几里得算法应用于模多项式〃 （ a ：) 和 r (工），产生次数 
分别为77? ， n ， n ! ，“•，《,，- 00 的多项式序列，其中 m = deg ( u)，n = deg ( w )， 且义>0。假设 

no 如果 l / U ) 和是首一多项式，且在次数分别为 m 和 72 的所有沪+〃对首一多项式上独立 
并一致地分布，则作为 m , n 和的函数，三个 M 纟，72】+…+ n c ,(n -〜）〜+…+ ( n t - } - n L ) n t 

的平均值是多少？（这三个量是欧几里得算法应用于模/>多项式时的运行时间中的基本要素，其 
中假定除法是通过算法 D 完成的。）[提示 ：证明 W (： r ) mod (: r )— 致分布且与无关。] 

5. [ M 22] 如果 Wx ) 和 Vi ) 都是独立地一致分布的^次首一多项式，则 〃 U ) 和模户 
互素的概率为何？ 

6. [ M 23] 我们已经看到，整数的欧几里得算法可直接改编成求多项式的最大公因子的一个 
算法。能否以类似的方式把“二进 gcd 算法”（即算法 4.5.2 B ) 改编为多项式算法？ 

y.[Mio] 在一个惟一因子分解整环 s 上，多项式整环中的所有单位元素是哪些？ 

► 8.[ M 22] 证明如果整系数的一个多项式在整数环上不可约，则把它当做有理数域上的--个 
多项式时也是不可约的。 
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9. [ M 25] 设 u ( jc ) 和 1(：?：) 是一个惟一因子分解整环上的本原多项式。证明当且仅当有 S 

上的多项式〃 U ) 和使得 u ( x ) V { x ) + 是一个次数为0的多项式时， LT (： r ) 和 

V (^) 互素。[提 示：如 同习题3中扩充算法4.5.2八那样扩充算法£。] 

10. [ M 28] 证明 ，一 个惟一因子分解整环上的多项式形成一个惟一因子分解整环。[提示：使 

用习题9的结果来帮助证明，至多可能有一种类型的因子分解。] 

11. [ M 22] 如果次数序列已经是9,6,5,2, - ⑺，而不是8，6，4，2,1，0，则表1中出现什么行 


名称？ 

► 12 . [ M 24 ] 设 “/:^^心卜^心^^…是在算法匚的一个运行期间得到的 一 个多项式序列。 
“ Sylvester 矩阵”是由行 A ，,^ 直到 A G ， t 直到^形成的一个方阵（在类似于表1的那种记法 

下）。证明如果 m ( x ) 和 w 2 ( jc ) 有一个正次数的公因子，则 Sylvester 矩阵的行列式为0;反之，若 
对某个 IdegUJsQ ， 试借助于八七）和 deg (〜々，推导它的绝对值的一个公式，以证明 


Sylvester 矩阵的行列式非零。 

13.[ M 22] 证明，当 


时，如同 （28) 中所 7 K ， gcd ( m (: r ), r (: c )) 的本原部 


分的前导系数/进入算法 C 的多项式序列。什么是一般的&的特性? 


14. [ M 29] 设 rU ) 是当 wU ) 伪除以 rU ) 时的伪余式。如果 deg ( u )> deg ( v ) +2, 且 
deg ( v )^ deg ( r ) +2,证明 r (: c ) 是《（幻）的倍数。 

15. [ M 26] 证明阿达马不等式（25)。[提 示：考 虑矩阵 AA t 0 ] 

► 16. [ M 22] 设 / U 卜…， 心）是不恒等于零的一个多变 M 多项式，且设 r ( S , ，…， S „) 是 fU 卜 

…，、）=0的根（:^，…， ；） 的集合，使得々65 1 ，..‘，^€5,,。如果/中变量: r , 的次数至多是 


< ls ; l ，证明 

r ( S { ，-■- ,SJ I < I S, I ■••! s„ I - ( I Si I - di) … （ I I - A) 

因此，当集合 S ; 变得更大时，随机地求一个根的概率 I KSi ，…， S „) 1/1 Si 卜_ 1 SJ 趋于零。[这个 
不等式在设计随机化算法时有许多应用，因为它提供了检验和的积的复杂和是否为零而无须展 


开所有项的一个好方法。] 

17 . [ M 32 ] (对于串多项式除法的 P . M . Cohn 算法） 设 A 是一个 字母表 ，即符号的集合。 A 
上的一个串 a 是„>0个符号的一个序列 a 二其中每个屮都在 A 中。 a 的长度以 UI 表 

示，是符号的个数”。 A 上的串多项式是有限和 U 二其中每个 q 是一非零有理数而且每 


个〜是 A 上的一 个串； 假定当 j ^ k 时，士乒以。如果 U 二 0( 即，如果和为空），则 U 的次数 deg 
(17) 定义为 - 否则 deg ( W ) = max | a,io 串多项式的和与积以显然的方式定义；因此 （) • 


具 ，其中两个串的乘积通过简单地并列它们而得到，然后我们收集同 类项。 

例如，如果 A = U , 6 I , L ； = M 十 k — 26 , V = a 十 6 — 1 ， 则 deg( U) = 2 ， deg( V) = l, V 2 = aa 


+ ab + ba + bb ~ 2 a — 26 + 1, V 2 — U 


aa 



bb + lo 显然， deg ( UV ) = deg ( U ) + deg ( V )， deg ( U 


+ V )< max ( deg ( U ) ， deg ( V )) ，在后一公式中，如果 deg ( LO 关 deg ( V ) ，则等号成立。（除了在乘 
法之下变量不可交换外，串多项式可以认为是有理数域上通常的多变量多项式。用通常的纯粹 
数学的语言来说，具有如这里所定义的运算的串多项式集合，是有理数上由 A 生成的“自由结合 


代数”。） 

a) 设 QhQ^L/， V 是具有 deg(L/)>deg( deg( U _ Q 2 V) < deg( Q , L0 的串多项式。 

试给出一个算法来求一串多项式0，使3明（17-0\0<3明（(7)。（于是如果给了我们 U 和V，使 
得对某个 Qi 和 Q 2 ，Q! Q 2 V + 尺和 deg (^)< deg(Q 1 U) ，则这些条件有一个 A 二1解。） 

b) 给定 U 和V是对于某个 Qi 和 Q2 具有 deg( V) >deg(Qi 1/ - Q 2 V)的串多项式。证明 n) 
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的结果可被改进来求一个商 Q ， 使得 L /- QV + i ?, deg ( J R )< deg ( V) c (对于串多项式，这类似于 
( l ); a ) 说明，在较弱的假定下，我们可以使得 deg ( i ?)< de g ( L /) o ) 

c ) 一个齐次多项式是这样一个多项式，其中所有项有相同的次数（长度）。如果 U lf U 2 , V ly 

V 2 是满足 L / 2 V 2 和 deg ( V 1 )> deg ( V 2 ) 的齐次串多项式，证明有一个齐次串多项式（7, 
使得 1/ 2 二 LAL / 和 ％ = UV 2 。 

d ) 给定 LT 和 V 是满足 L / V = VI ；的齐次串多项式，证明对某些整数 m , n 和有理数 r ， 5 , 有 
一个齐次串多项式 w ■使得试给出一个算法来计算有最大次数的这样一个 
W 。 （这个算法是有趣的，例如，当 L / = a 和 V = P 是满足和的串时，则 W 只不过是一个串 
y 。 当”和 V = : r ” 时，最大次数的解是串 W = _ x g (： d ( 〉 ，所以这个算法包括了整数的 g C d 算 
法，作为一个特殊情况。） 

► 18.[ M 24] (串多项式的欧几里得算法）设％和 V 2 是不全为0的串多项式，且具有一个公 

共的左倍串。（这意味着存在不全为零的串多项式 A 和1/ 2 ，使得 U l V [ = U 2 V 2 。:) 本题的目的 

是求一个算法来计算它们的最 大公共右因串 g cr d ( \^， V 2 )， 以及最 小公共左倍串 lclm ( V ,, V 2 ) c 

后面的 M •定义 如下： gcrd ( \^， V 2 ) 是 A 和 V 2 的公共右因串（即对某个 Wi 和 W 2 , V , - , 

gcrd ( ， V 2 ) 和 V 2 ^ ^2 gcrd ( V l , V 2 )) ，而且 V ,和 V 2 的任何公共右因串是 gcrd ( A ， V 2 ) 的一 

个右 因串； 对某个 A 和 Z 2 ， ldm ( %， V 2 ) 二，而且％和 V 2 的任何公共左倍串是 
lclm ( V { , V 2 ) 的一个左倍串。 

例如，设 U -[ = abbbab + abbab — bbab + — 1 ， V \ = babab + abab + ab — b ; U2 — dbb + ab ~ b , 

^ 2 ~ babbabab + bababab + babab + abab - babb - 1。则我们有 U { V { ~ U 2 V2 — abbbabbabab + 


abbabbabab + abbbababab + abhababab — bbabbabab + abbbabab — bbababab 七 2 abbabab - abbbabb + 

ababab - abbabb - bbabab - babab + bbabb — abb _ ab + b 。 对于这些串多项式，可以证明 gcrd ( V !, 

V 2 ) = + 1，且 lclm ( Vj , V 2 ) ^ Ui V ' 。 


习题 17 的除法箅法可改述如下 ：如果 ％和 V 2 是串多项式， V 2 ^0, 而且如果和 U 


满足等式 U X V X = L / 2 V 2 ，则存在串多项式 Q 和只使得 



V 1 — QV 2 + R ,其中 deg ( R ) < deg ( V 2 ) 

容易推出， Q 和是惟一确 定的； 它们不依赖于给定的和 U 2 。 而且在下列意义下，结果是左 
右对 称的： 

U 2 二 U { Q + ，其中 degiR ') = deg ( U - deg ( V 2 ) + deg ( R ) < deg ( ) 

证明这一除法算法可被推广成一个这样的算法，它计算 lclm ( Vj , V 2 ) 及 gcrd ( V t , V 2 ); 事实 
上，推广的算法求串多项式 Z 〗，. Z 2 ，使得 Z , V ! + Z 2 V 2 = gcrd ( \^，\/ 2 )。[提示 ：使用 辅助变 M 

U 2 ,Vi } W 2 , w \ , -W2 , Z] , Z 2 , z \ , 2：2 , 它们的值是串多项式；从置 ui — Ui ， U 2 — U2 ， — 

V l 9 v 2 <- V 2 开始，并且在整个算法中每当进行第 《 次迭代时，维持条件 


UiU) Y U 2 U ) 2 = U[ } 2；! + 2 ： 2 V 2 = v x 

UiW I + U 2^2 ~ w 2 ， z \ ^1 ^ z \ ^2 = v 2 
^ \ z l ^ ^2 Z \ — (— 1 ) }i U i , W { Vi ~ U}' \V 2 — (- l) N V[ 

—ui z 2 + u 2 z 1 = (— 1) ” U 2 ， — wjV \ + w \ v 2 — (-1)” V 2 

这可以认为是欧几里得算法的“最终的”扩充。] 

19.[ M 39] (方阵的公共因子） 习题18表明，当乘法不可交换时，最大公共右因子的概念可以 
是有意义的。证明任何两个” X „阶整数矩阵 A 和 B 有最大公共右矩阵因子 I )。[建议 ：设计 一 
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个其输人为 A 和 B ， 且其输出为整数矩阵 D , P , Q , X , Y 的算法，其中 A = PD,B - QD , D - 

XA + yB 0 ] 求矩阵 G U 和 d f ) 的最大公共右因子。 

20. [ M 40] 研究欧几里得算法的 精度： 关于计算其系数是浮点数的多项式的最大公因子，你 
能说些什么？ 

21. [ M 25] 如果诸给定多项式系数的绝对值以 N 为界，证明为计算整数上两个”次多项式 

的 gcd ， 算法 C 所要求的计算时间是 OU 4 (bg Nn) 2 )o 

22. [ M 23] 证明 Suirm 定理。[提 示：某 些符号序列是不可能的。] 

23. [ M 22] 证明如果 （29) 中的 u (. r ) 有 deg ( w .) 个实根，则对于，我们有 degU J + 1 ) = 

deg ( Uj ) - 1。 

24. [ M 2 J ] 证明 （19) 可简化为 （20)，（23) 可简化为 （24)。 

25. [ M 24]( W . S . Brown ) 证明对于， （ 16) 中的所有多项式七“）是 gcdUU )，€( t ；)) 的 

倍数，并且说明由此如何改进算法 C 。 _ 

► 26. [ M 26] 本题的目 的是： 给出关于下列事实在多项式中的类似结果，即，正整数元素的连 

分数给出对实数的最好近似（习题4.5.3-42)。 

设 w ( x ) 和 x ；( x ) 是一个域上的多项式， degU ) > degO )， 并设当欧几里得算法应用于 u ( x ) 
和 时，〜 （: r )， a 2 U )， …为商多项式。例如， （5) 和 （6) 中的商序列是 9 x 2 + 1,5 x 2 + 5 f 6 x 2 + 

5 x 2 + 6 ：r + 5,9 x + 12。 我们希望证明连分数//〜（：0 4 2 “），一//的收敛项九 U )/ g „ U ) 是有理 

函数 iKdMU ) 的低次“最好近似”，其中借助于等式 4 .5.3-( 4 )的连续多项式，我们有 P » 

^ (q U ) ，… ，〜 （工））。根据约定，我们命 p 0 (^) = 

q -\( x ) —0 y p -[( x ) — Qq ( x ) — 1 o 

证明 ：如果 和 g ( I ) 都是使得对某个7? > 1， deg ( g ) < deg ( g ，,） 及 deg ( pu - qvX 

deg ( t w -〜_ ! u ) 的多项式，则对某个常数 c , p ( x ) = cp u - 〖 （ x ) 和 q ( x ) = cq n . l { x ) o 特别是， 
每个在下列定义下是一个“破记录”的多项式，就是对于任何多项式 P ( J ， 没有较小次数的 
非零多项式 g (: c ) 能使 ) w (: c ) _ <7(工）17(^:)达到像 p n { x ) u ( x ) ~ 那样小的次数。 

27. [ M 23] 当我们预先知道余式将为零时，提出一个加速^工）除以 W . z ) 的方法。 

<4.6.2 多项式的因子分解 

现在让我们考虑多项式的因子分解问题，而不仅仅求两个或多个多项式的最大 
公因子。 

以模 p 进行因子分解 如同在整数情况下那样 (4.5. 2,4. 5.4 小节)子分解 
的问题似乎比求最大公因子更为困难。但是在模一个素整数 f 之下进行多项式的 
因子分解，并不像我们所意料的那样困难。比起使用任何已知的方法求一任意”位 
二进数值的因子来，求任意〃次多项式在模2之下的因子，要容易得多。这令人惊 
奇的情况是1967年 Elwyn R . Berlekamp 所发现的 一 个启发性的因子分解算法的推 
论 [ Be " System Technical J . 46 (1967), 1853 〜 1859] 。 

设是 一 个素数；以下讨论中对于多项式的所有算术都将在模 P 之下进行。 
假设有人已经给了我们一个多项式《(工），其系数是从集合10,1 ，…， p - 1丨中选择 
的；我们可以假定 W (: T ) 是首一的。我们的目标是把 W ( X ) 表达成形式 
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u(x) = pY(X 、 e '… p r (JcY r (1) 

其中，…，是不同的首一不可约多项式 D 

作为头一步，我们可以使用一个标准技术来确定^ ，…， ~中是否有大于1者。 

如果 

u(x) = u n x n + **■ + w 0 = v(x) 2 w(x) (2) 

则它（以通常方式，但在模 f 下）形成的导数是 

« (x) = 1 + …+ …= 2v(x) v' (jo) w(x) + v(x ) 2 w' (x) (3) 

而且这是平方后的因子(: r ) 的倍数，因此我们分解 W ( z ) 的头一步是构造 

gcd( ,u (x)) = d(x) (4) 

如果 dU ) 等于1，则我们知道 z / U ) 是无平方的，是不同素因子 p ' U 、，一， p r U 、 

的乘积。如果(: T ) 不等于1，而且 dix )^ u { x ) , jj 5 !j d ( x ) 是 w ( x ) 的一个真因子; 
在(: T) 的因子和 W (X )/<i (: C ) 的因子之间的关系在这种情况下极好地加速了因子 
分解过程（见习题34和36)。最后，如果 d ( x ) = wU )， 则必然有 /( Jr ) =0;因此 

P 的系数心仅当々是 p 的倍数时为非零。这意味着可以写成为形如 vU p 、 
的一个多项式，而且在这样的情况下，我们有 

u(x) = v(x p ) = (v(j:)) p ( 5 ) 

这一因子分解的过程可以通过求 Wx ) 的不可约因子并求它们的 f 次方来完成。 

恒等式 （ 5 ) 对于读者可能显得有些 陌生； 它是一个重要的事实，它对于 
Berlekamp 的算法和我们所要讨论的好些个其它方法说来是基本的。可以证明它如 
下 ：如果 wO ) 和。 2 (：0是任意模> 多项式，则 


(v l (x) + v 2 (oc)) p 




因为二项式系数0,…都是0的倍数。而且，如果 a 是任意整数，则由费 

马定理 (modulo p) Q 因此，当。（: c) = v m x m + + **• + v Q 时，我们求 

得 


v(x) p = ( v m x m ) p + ( + •■- + ( 幻。广 = 

v m x mp + 〜―+ …+ i； 0 = v(x p ) 

上述注释说明了，分解一个多项式的问题归结为分解一个无平方的多项式的问 
题，因此我们假定 


u{x) = p】 （: r )p 2 (x) … /v(:r) (6) 

是不同素元的乘积。当仅给出 w (: r ) 时，我们怎么能巧妙地发现诸 岛 （ x ) 呢? 

Berlekamp 的思想是利用中国剩余定理，如同这个定理对于整数都是正确的一样，它 
对多项式也正确（见习题3)。如果（心， 52 ，… ，心） 是模 f 的整数 r 元组，则中国剩余 
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定理意味着有 一 •惟 一 的多项式 v(x ) 使得 

v ( x ) = S [ (modulo ，…， v ( x ) 三 s r (modulo p r ( x )) 

(7) 

deg ( v ) < deg ( p \) + deg ( p 2 ) + …十 deg ( p r ) = deg ( u ) 

这里出现的记法 “g (: r ) 三 / i ( : r )( modulo /(: c ))” 和在习题 3.2.2-11 中的 “ g (: c ) 三 

ZiU ) (模 / U ) 和 {)” 有相同的定义，因为我们正在考虑模 f 之下的多项式算术。 

(7) 中的多项式 Wz ) 给了我们一个得到 W (: r ) 的因子的办法，因为如果且^ 

7^2,则 gcd ( W (: r ) ， _ h ) 可为 P〆 :?:）， 但不为夕 2 ( 工）所整除。 

由于这一发现表明可以从 (7) 的适当的解得到关于以: c ) 的因子的信息，让我们 
更仔细地分析（7)。首先，我们可以发现对于多项式4工）满足条件 

v { x ) t> = s l -= s J = v { x ) (modulo pj ( x )) y 因此 

v ( x) p = v ( x ) (modulo u ( x )) y deg ( t ;) < deg ( w ) (8) 

其次，有基本的恒等式 

SC P ~ JO = (x - 0 )(x - - (p - 1)) (modulo p ) (9) 

(见习题 6); 因此在模 > 之下进行工作时 

v ( x) p - v { x ) = ( v ( x ) - 0) ( I ；( x ) - 1) … （ t ; (: c ) - (f - 1)) (10) 

是对于任何多项式 rO ) 的一个恒等式。如果 I ；(: c ) 满足（8)，则 M (: C ) 应能整除 
(10) 的左边，所以 zK ： r ) 的每个不可约因子必然整除 （10) 右边的 p 个互素的因子之 
一。 换句话说，对于某些 h ， 5 2 ，…， \ ， （8) 的所有解必定有 （7) 的形式;恰好有 〆 个 

(8) 的解。 

因此，同余式 （8) 的解(: r ) 提供了对 〃（: r ) 进行因子分解的一把钥匙。首先求 
(8) 的所有解似乎比分解 〃（ x ) 要更困难，但事实上并非如此，因为 （8) 的解的集合在 

加法之下是封闭的。设 deg ( w ) = / 2 ; 我们可以构造 nXn 矩阵 

90,0 ^0,1 … ^0^,-1 

Q = ; ; ; 

1，0 Qn ~ \ , 1 Qn ~ I , n - I y 

其中 

工 卟三 + **■ + QkA^ + ^ t o(modulo u(jo)) 

则 = 1 + … + w：c + 是 （8) 的解当且仅当 

(D 0 , w_，％])Q = (vQyVi ，^* , v n ^ x ) 

因为后一等式成立，当且仅当 

幻“)= 2 = S S 幻氣 〆 三 

) j k 

Vh^ pk — v ( x p ) 三 7^ ( x)^(modulo u { x )) 

k 

因此， Berlekamp 分解算法如下： 

B 1 •确保^：0是无平方的；换句话说，如果 § 以“（工），/(：0)#1，则按照这小 
节早先所指出的方法简化分解 W (: r ) 的问题。 
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( 11 ) 

( 12 ) 

(13) 



B 2 •构造 （11) 和 （12) 所定义的矩阵。这可以如同下边所说明的那样，依赖于 
是否很大，以两个方式之一来完成。 

B 3 •“ 三角化”矩阵 Q - / ， 其中 J = ( ~ ) 是7? x ??阶单位矩阵，求它的秩数；2 - r 

和线性无关向量“"，…，^^使得对于 - 7) = (0, 

0)。（第一个向量 p [1] 总可以取作（1，0,…，0)，表示 （8) 的平凡解 t ; [1] ( x ) = 
1 。 计算可以利用适当的列操作来进行，如同在下边的算法 N 中所说明的 
那样。)这时，的不可约®子的个数，因为 （8) 的解是对于所有满足 

p 的整数选择对应于向量+ … + 的，个多项 

式。因此，如果 r = l ， 则以: r ) 是不可约的，且过程终止。 

B 4 •对于0<5<声，计算 g C d (以 x )，# 2] u ) i )， 其中 J 2 ] u ) 是由向量 v [2] m 
示的多项式。这个结果将是〃（: r ) 的一个非平凡的因子分解，因为^ [2] (^) 
- s 是非0的，而且次数小于 degU )， 由习题7,每当 wU ) 满足 （8) 时，我们 
有 

u{x) - JJ gcd ( v{x) - s y u(x)) (14) 

0 < 5 < p 

如果未 雖成功 地使用 l /~(： T ) 把〃（: T ) 分解成 r 个因子，则通过对于 

</>和迄今为止找到的所有因子加 U )， 及々二3,4,…，计算 gcd (^ U ] ( x )- s , 
wU ))， 能够得到进一步的因子，直至得到 r 个因子为止。（如果在 （7) 中选择 
\ \，则我们得到 （ 8 ) 的一个解 r ( jc ) ，它把丸 (工） 与岛 （: r ) 区别开来；某个 

w U ] U ) _ s 将可为 A . U ) 而不为岛 ( x ) 所整除，所以这一过程最终将找到所有 
的因子。） 

如果 p 是2或3,则步骤 B 4 的计算十分 有效； 但如果/>很大，比如说大于 
25,则如同我们后边将看到的那样，有好得多的方法来做。 | 

历史注记： M . C . R . Butler [ Quarf ,人 Math . 5 (1954) ，102 〜 107] 发现对应于有 r 

个不可约因子的一个无平方多项式的矩阵 Q - J ， 有秩 n _ ”，模 p 。 实际上，这一事 
实蕴涵在 K . Petr [ Casop/s pro P^stovani Matematihy a Fysiky 66 (1937) ， 85 〜 94] 的 

一个更一般的结果当中， Petr 确定了 Q 的特征多项式，也参见 §. Schwar Z ， QuanJ . 
Math. 7 (1956)，110〜124。 

作为算法 B 的例子，现在让我们确定在模13下 

u(x) = : r 8 十 x 6 十 10 x 4 十 10 x J + Sx 2 + 2x + 8 (15) 

的因子分解（这一多项式在 4.6.1 小节的若干例子中出现）。使用算法 4.6.1 E 的快 
速计算表明， gcdUU ),/( x )) 二1;因此 ，^ U ) 是无平方的，我们再转到步骤 B 2。 
步骤 B 2 包含计算矩阵 Q ， 在现在情况下它是 8 X 8 阶的阵列。 Q 的头一行总是（1， 

0 ， 0 ，…， 0 ) ， 表 7 K 多项式 ： r G mod u{x) = 1 0 第二行表示： r 13 mod u (: r ) ， 而且，（对于 
较小的 6 值） 一 般地 ， P mod 〃（:0可以容易地确定如下 ：如果 

u(x) = + U n _iX T1 ~ l + + U\X + Uq 

而且如果 
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x k = a k ^^ x x n ~ A + ••- + a kA x + a 々 ， 0 (modulo u ( x )) 

则 

工 + 三 ^ ， „- 1 :" 1 十…十 a kyV x + a k>0 Jo = 

a 々，„ — 1 (- u n - x x n ~ l - *** - u { x - u 0 ) + a 々，„ — 2 ? — 1 + …+ a kyQ x = 
a 々 + i，, ； - I〆 -1 + … + a k ^ lA x + a k+u0 

其中 

^k +1 ,j _ a k 、 j - ' a 々，” —i w ) (16) 

在这个公式中把当做 0 来处理，所以 a k + [f0 = ib — w 。 简单的“移位寄存 

器”递推式 （16) 使得对于々=1，2,3,…， U -1) 户容易计算 P mo “（ 工）。当然，在 
一 台计算机里边，这一计算一般是通过维持一个一维数组（〜^，…， q ， a Q ) 并反复 

地置 

t — a n . x , a n . x ( a „— 2 - tu n ^ x ) mod p ，…， — ( a Q - tu Y ) mod p 

以及 a 0 -(-^ 0 ) mod p 来进行。（我们已经看见过同随机数生成相联系的类似过 

程， 3.2. 2 - (10)。）对于 （15) 中所举的多项式例子 w (: r )， 利用模13算术，可得到下 
列/ mod w (: c ) 的系数序列： 

k a kyl a k>6 a ki5 a kA a k ^ a ky2 a k,o 

000000001 
1 0 0 0 0 0 0 1 0 

200000100 
300001000 
400010000 
500100000 
601000000 
710000000 
80 12 0335 11 5 

9 12 033 5 11 50 

10 04328028 

11 43280280 

12 3 11 8 12 1 2 5 7 

13 11 5 12 10 11 7 1 2 

因此 Q 的第二行是 （2, 1,7,11，10, 12 ,5, 11)。 类似地，可以确定^ 26 mod 以 U )， …， 
: c 91 mod u { x ) ，而且求得 
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Q = 



6 

5 


Q ~~ I = 


0 0 0 0 0 0 0 ' 

1 7 11 10 12 5 11 

6 4 3 0 4 7 2 

3 6 5 1 6 2 3 

11 8 8 3 1 3 11 

11 8 6 2 7 10 9 

11 7 10 0 11 7 12 

3 12 5 0 11 9 12, 

1 0000000 ) 

2 0 7 11 10 12 5 11 

36330472 

4 3 6 4 1 6 2 3 

2 11 8 8 2 1 3 11 

6 11 8 6 2 6 10 9 

5 11 7 10 0 11 6 12 

、3 3 12 5 0 11 9 11, 



这就结束了步骤 B 2; B er lek a mp 过程的下一步需要求 Q - Z 的“零空间”。一般 
地说，假设 A 是一个域上的” X 〃 阶矩阵，它的秩数 n _ r 有待 确定； 进一步假设我 
们希望确定线性无关向量 t / 1 ]， J 2 ]， …， ‘，] ，使得 ^ [1] A = J 2 ]A =…=二 

(0，一，0)。对于这项计算的一个算法，可以这样的观察为基础，即 A 的任何列可以 
乘以一个非0的量，而且它的一个列的任何倍数都可加到不同的列上，而不改变向 

量# 1] ，…，的秩数（这些变换相当于以 AE 代替 A ， 其中 B 是一个非奇异矩 
阵）。因此可以使用下列熟知的“三角化” 过程： 

算法 N (零空间算法）设 A 是一个;7 x ^阶矩阵，其元素％.属于一个域，下标 

在范围内。这个算法输出 r 个向量^ [1] ，…，#” ] ，它们是在域上线性无 
关的，而且满足 r U ]A = (0，“.，0)，其中 72- r 是 A 的秩数。 

N 1 •[初始化]置 c Q — 1， r — 0。（在此计算期间，仅当 a ” = 

— 1及行的所有其它元素都为0时，才有 Cj ^ Oo ) 

N 2 •[对々进行循环]对于々=0，1，…， 72-1 进行步骤 N 3, 而后终止此算法。 
N 3 •[就相关性扫描行]如果在0<_； < n 的范围内，有某个 j ，使得 %关0和 

◦ <0,则执行下列过 程：以 -1/%乘 A 的第_；列（使得％变成- 1); 然后对 

所有把第 j 列的〜倍加到第 2 列 上去； 最后，置 Cj — k 0 (因为不难证 

明，对所有 s <々， a 5 」=0, 这些运算不影响 A 的 0，1 -1 行。） 

另一方面，如果在”的范围内没有 j 使得％关0和~ <0,则置 r —r + 
1，而且输出向量 


. 405 • 



第 4 章算术 


V = (v 0 ) Vi ，-*-, v u - { ) 

它由规则 

' CL ks ,如果 c 5 = 7 > 0 

Vj = ^ 1, 如果 ] 二 k (18) 

、0， 否则 

所定义。 

有一个例子可以揭示这一算法的机理。设 A 是整数模13域上 （17) 的矩阵 Q 
- lo 当々=0时，我们输出向量 t ； [1 ] 二（1，0,0,0,0,0,0,0)。当々=1时，我们可以 
在步骤 N 3 中取 ； 等于0,2,3,4,5,6或7之一；这里的选择完全是任意的，尽管它影 

响由本算法输岀的具体向量。对于手算，最方便的是取」=5,因为已有 fll5 = 12二 
-1; 步骤 N 3 的列操作则把 A 变成为矩阵 

0000000 0 ' 

00000 ⑫ 00 
11 6 5 8 1 4 1 7 

33959664 

4 11 2 6 12 1 8 9 

5 11 11 7 10 6 1 10 

1 11 6 1 6 11 9 3 

A 2 3 11 9 6 11 12 2. 

(在“5”列“1”行上画了圈的元素用来指示 c 5 = lo 记住，算法 N 对于矩阵的行和列 

的编号，是从0而不是从1开始的。）当 A =2时，我们可以选择 ； = 4并以类似的方 
式进行，而得到下列各矩阵，它们均有和 Q - I 相同的零 空间： 


k = 2 

0000000 0、 

00000 ⑫ 00 

0000 ⑫ 000 

8 1 3 11 4 9 10 6 

2 4 7 1 1 5 9 3 

12 3053545 

0 1 2 5 7 0 3 0 

.11 6 7 0 7 0 6 12, 
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k = 3 

'0 0 0 0 0 0 0 0、 

00000 ⑫ 00 
0000 ⑫ 000 

0 ⑫ 0 0 0000 
9989 11 885 

1 10 4 11 4 4 0 0 

5 12 12 7 3 4 6 7 

、2 7 2 12 9 1丄 11 2, 
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k = 4 


0 

0 

0 

0 

0 

0 

0 

0、 


r 0 

0 

0 

0 

0 

0 

0 

0 

0 

0 

0 

0 

0 

⑫ 

0 

0 


0 

0 

0 

0 

0 

⑫ 

0 

0 

0 

0 

0 

0 

⑫ 

0 

0 

0 


0 

0 

0 

0 

⑫ 

0 

0 

0 

0 

⑫ 

0 

0 

0 

0 

0 

0 


0 

⑫ 

0 

0 

0 

0 

0 

0 

0 

0 

0 

0 

0 

0 

0 

⑫ 


0 

0 

0 

0 

0 

0 

0 

⑫ 

1 

10 

4 

11 

4 

4 

0 

0 


⑫ 

0 

0 

0 

0 

0 

0 

0 

8 

2 

6 

10 

11 

11 

0 

9 


5 

0 

0 

0 

5 

5 

0 

9 

、1 

6 

4 

11 

2 

0 

0 

10, 


.12 

9 

0 

0 

11 

9 

0 

10, 


现在没有画圈元素的每一列全为0;所以当々= 6和々=7时，此算法另外输出两个 
向量，即 

二 (0,5, 5,0,9,5, 1,0), i / 3 ] = (0,9,11,9,10,12,0,1) 

在々=5之后，由矩阵 A 的形式可知，这些向量显然满足方程 M = (0，_"，0)。 因为 
这个计算产生了三个线性无关的向量，故 W ： r ) 必然恰有三个不可约的因子。 

最后，我们可以转到分解过程的步骤 B 4。 对于0<^<13计算 gcdUU )， 

# 2 ](: r )_ d ， 其中1；[ 2] (工）=工 6 十51 5 十9工 4 + 5工 2 + 5工，当 s = 0 时给出答案 X 5 十 

5/ +9 x 3 + 5: r + 5,当 5 = 2时给出： r 3 + 8: r 2 + 4 :c + 12;而对于 s 的其它值 gcd 是 1。 

因此# 2] (:0仅仅给了三个因子中的两个。转到 gcd ( z ； [3] ( x )~5,^ 5 + 5 x 4 +9^ 3 + 
5 x + 5)， 其中 (: r ) = : c 7 + 12 x 5 + 10 x 4 + 9 x 3 + llx 2 + 9： r ，当 s = 6时，我们得到 
值: r 4 + 2: r 3 + 3: r 2 + 4 :r + 6 j 5 = 8时，得到 ： c + 3 ， 当 s 为其它值时得到1。于是完 

全的因子分解是 

u { x ) = ( x 4 + 2 x 3 + 3 x 2 + Ax + 6)( x 3 + 8 x 2 + 4 x + 12) (x + 3 ) (19) 

现在让我们来估计当在模下分解”次多项式时的 Berlekamp 方法的运行时 
间。首先假定 p 比较小，使得四种算术运算在模 > 下可以在实际上固定长度的时 
间内完成。（通过如习题9中所提议的那样存储一份倒数表，模 P 除法可以转换成 

乘法； 例如当以模13进行工作时，我们有| = 7，| = 9等等。）步骤 B 1 中的计算花 

费 OU 2 ) 个时间 单位； 步骤 B 2 花费0(_ 2 )个。对于步骤 B 3 我们使用算法 N ， 它 
顶多要求 0( n 3 ) 个时间单位。最后，在步骤 B 4 中，我们可以发现，用欧几里得算法 
计算 g C d (/( x )， gU )) 花费 0( deg (/) deg ( g )) 个时间 单位； 因此对于固定的 H 
以及对于迄今业已找到的 wU ) 的所有因子 wU )， 计算 gcd(v [j] (^) u ， （: r )) 花 
费 0( n 2 ) 个时间单位。因而步骤 B 4 至多要求 0( pr ?) 个时间单位。当是小的 
素数时, Berlekamp 过程在 0( tz 3 十 pm 1 ) 步内分解在模 p 之下的任意 n 次多項式；而 
习题5表明，平均的因子数 r 近似于 In / 2 。因此这个算法要比分解 f 进系统中”位 

数的任何已知方法都要快得多。 

当然，当 „ 和^很小时 ，一 个类似于算法 4.5.4 A 的试错法因子分解过程甚至 
比 Berlekamp 的方法还要快。习题1意味着，即使当 n 很大时，在进行任何更复杂 
的过程之前，先把小次数的因子剔出来是一个好主意。 
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当 p 很大时，将使用 Berlekamp 过程的另一种不同的实现办法进行计算 。模广 
除法不再使用任何辅助的倒数表来进行，大概将代之以使用习题 4 . 5 . 2-16 的方法， 
它花费 0 ((log f ) 2 ) 步。然后步骤 B 1 将花费 0 (” 2 (log />) 2 )个单位 时间； 类似地， 
步骤 B 3 花费 OU 3 (bg p ) 2 ) 个单位时间。在步骤 B 2 中，当 p 很大时，我们可用比 
(16) 更有效的方式构造/ mod ^ ( x ) ：4.6. 3小节说明，这个值实际上可以通过使 
用 0 (log p ) 个平方模“ （ x ) 的操作，从 」 mod w ( I )变成 mod “（2)，并且同乘 
以： r 的操作一起而得到。如果我们对于 m = r ? , n + 1, •** ,2 r ? - 2首先造一份 
mod wO ) 的辅助表，则这一平方操作相对说来是容易实施的；如果 P mod u 、 x 、二 

— 1 + …+ c x x + co ，则有 

x 2k mod u { x ) = ( c ^ — jjr 2 " 7 - 2 + … + ( qc 。+ C \ Cq)x + Cq ) mod u ( x ) 

其中： r 2 〃- 2 ,…，/可用辅助表中的多项式代替。计算 P mod “ U ) 的全部时间需 
要 OU 2 ( log >) 3 ) 个单位，这样我们就得到了 Q 的第二行。为了得到 Q 的更多行， 
只须以类似于平方模 wU ) 的方式重复地 乘以/ mod “ U )， 我们就可计算 

mod u ( x ), x 3p mod w (x ) ， …； 步骤 B 2 在另外的 0( n 3 (log />) 2 ) 个时间单位内完 
成。 于 是步骤 B 1， B 2， B 3 总共花费 0( n 2 (log />) 3 + n 3 (log ) 2 ) 个时间单位；这三个 

步骤能告诉我们〃（: r ) 的因子个数。 

但当 f 很大且我们达到步骤 B 4 时，要求我 们对户 个不同的 5 值计算最大公因 

子，甚至当 p 仅仅是中等规模时这也办不到。这一障碍首先被 Hans Zassenhaus 所 

WBU-Number Theory 1 (1969) ，291〜311 ] ，他说明了如何确定所有“有用的” ^值 
(见习题 14) ;而一个甚至更好的处理方法是由 Zassenhaus 和 Cantor 于1980年发现 

的。如果 r (: r ) 是 （8) 的任意一个解，那么我们知道 “（ X ) 整除 v ( x) p - v ( x ) = 
v ( x )-( v ( x ) {/) ~ [)12 + l )-( v ( x ) ip ~ l)l2 _ 1)。 这就提示我们计算 

gcd ( u ( jc ) j v ( x)^ p 1 ^ 2 — 1) (20) 

很幸运， （20) 将是 w (: r ) 的一个非平凡的因子。事实上，通过考虑(7)，可以精确地确 
定我们运气的大小。设对于 rU ) 三 ^ modulo 朽 （: r )), 则岛 U ) 整除 

v ( x ) ip ~ l)l2 - 1 当且仅当 5 /^ ~ 1)/2 = 1( modulo p ) o 我们知道，在 s < P 范围内恰 

有 （p - 1)/2 个整数 s 满足 / p - 1)/2 El(modub p ) ， 因此大约有一半的外 （•!：） 将出现 

于 (20) 的 gcd 中。更确切地说，如果 uO ) 是 (8) 的一个随机的解，其中所有的 〆 解 
都是同样可能的，则 （20) 的 gcd 等于 w (: r ) 的概率恰是 （（f _ 1)/2^ ) r ，而它等于1 
的概率是 （（/? + 1) /2>)，。因此对于所有的 r >2 和0>3,得到一个非平凡的因子的 


概率是 






因此，除非 f 十分小，用下边的过程来代替步骤 B4 是 


个好主意：置 v ( x )^~ 


aj v 


[1 


X 



a 2 v 


[ 2 ] 


X 


)+ 


+ a r v 


X 


，其中诸系数 〜 是在0<七</)的范围内随 


机选择的。设的当前的部分因子分解是心（:其中 t 开始时为1， 


对所有使得 degU /: )>l 的 z 计算 
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gi ( oo ) = gcd ( u t ( x ) , v ( x ) {p ~ l)i2 - 1) 

每当找到一个非平凡的 gcd 时，就用 & U ) (〜 U)/a (: T )) 代替 aU ) 且增加 Z 的 

值。对于不同的 u(：r ) 重复这一过程直到 t = r 为止。 

如果假定（因为我们可以这样做）只需要 （8) 的 0 (log r ) 个随机解 d (: r ), 就可 
以给出为实施 B 4 这一替换步骤所要求的时间之上界，它花费 0( r〃（log p ) 2 ) 步计 
算 Wi ); 而且如果 degU 7 ) = d ， 则它花费 OU 2 (log /0 3 )步计算 ^( x ) (/J - j " 2 mod 

〜 (>) 及另外的 0( d 2 (\og p ) 2 ) 步计算 gcd ( ui ( x ) , v ( x ) (p ~ {)12 - l) Q 因此总共的 
时间是 O (72 2 (log p ) 3 log r ) 。 

不同次数的因子分解 我们现在将回过头来寻求模 p 下的因子的一个稍许更 
简单的方法。在本小节我们已经研究过的一些想法涉及许多对于计算代数的有教 
益的见解，所以作者不惜笔墨对它们作了 介绍； 但是，我们也发现，在模^之下进行 
因子分解的问题实际上无须依赖于这么多概念就能解决。 

首先我们可以利用这样一个事实，即一个 d 次不可约多项式^工）是的 

一 个因子，而且对于 l < c < d 它 不是: / - 2的一个因式，见习题16。因此通过釆 
取下列策略，我们可以分别剔除各次的不可约的因子。 

D 1 • 如同在 Berlekamp 方法中一样，排除平方因子。也置 v ( x ) — u ( 工、 ， 

W (: r ) — “： c ”， 以及 d — 0。（这里和 wU ) 是以多项式作为值的变 
量。） 

D2. (此时 u ;(^) = x // mod 的所有不可约因子都不同并有大于 d 

的次数。）如果 d + 1 > | deg ( r )， 这一过程即终止，因为我们或者有 
p ( jc ) = 1， 或者 r ( j ：) 不可约。否则 d 增加1且用 UU ( jc、 p mod w (:c ) 代替 

W ( JT ) 。 

D 3 •求 g d ( x ) = gcd ( vu ( x ) - (: c ))。 （这是其次数为 d 的 w (: c ) 的所有不 

可约因子的乘积。）如果心（幻尹1，则用 t ； (: r )/ 心 U ) 代替 Wx ) 以及用 
U ){ x ) mod W (: r ) 代替 w (: r ); 而如果心 （: c ) 的次数大于 d ，则用以下的算 
法来求它的因子。返回步骤 D 2。 | 

这一过程确定每个次数^的诸不可约因子的乘积，因此它告知我们各个次数有 
多少个因子。由于在我们举例的多项式 （19) 中三个因子有不同的次数，因此无须分 
解多项式心（:0就可全部发现它们。 

为了完成这一方法，当 deg ( g J > d 时，我们需要有一种方法来把多项式 

分解成为它的不可约因子 ， Mkhael Rabin 于1976年指出，这可以通过在有 〆 个元 
素的域中进彳了算术运算来实现 。 David G . Cantor 和 Hans Zassenhaus 于1979年发 

现，以下列恒等式为基础，甚至有更为简单的处理方法 J 卩果 p 是任何奇素数，则对 
于所有多项式 〖（ a 、）， 我们有 
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gd(^) 


gcd ( g d ( x ) yt ( x )) - gcd ( g d ( x ) , t ( x) (p ' 1)/2 



1) 


gcd(^( 


X 


(工 ）( 户 


d 


- 1)/2 


-1) 


( 21 ) 


因为是 d 次的所有不可约多项式的倍数。（我们可以认为 Mi ) 是大 
小为/的域的一个元素，其中该域由如习题16中那样的模一个不可约多项式 
/ U ) 的所有多项式组成。）现在习题29表明，当 （ U ) 是小于等于 2 d ~ l 次的一个 


随机多项式时， gcd (& (: c ) yt ( x )^ /} 


1)/2 


1) 有大约50%的机会将是&(: T ) 的一个 


非平凡 因子； 因此发现所有这些因式将不需要许多随机的试验。不失一般性，我们 

可以假定 K ： r ) 是首一的，因为 r ( x ) 的整数倍没有造成区别，顶多把 Z ( x ) (/ _ 1)/2 改 
变成它的负值。于是在 d = l 的情况下，我们可以取 以: r ；) = :r + s ， 其中 s 是随机选 
定的。 

当只使用线性多项式 Z ( x ) 时，对于^>1，有时这一过程可能成功。例如，在模 
3下有8个三次不可约多项式 /( z ) ，而且通过对于 0< s <3 计算 gcd ( f ( x)Ax + 

5) 13 - 1)，它们都将被区分开： 



X 


S 


0 


S 


S 



X 



X 


3 



X 



X 


2 



X 



X 


+ 


2 x + 1 

1 

1 

1 

2 x +2 

/(工） 

f ( oc ) 

/(:) 

2 

/(工） 

/( 工） 

1 

x + 2 

/( 工） 

1 

f (工） 


X 



X 


2 


+ 2 x + 


1 



X 


/( 工） 


x 


+ 2 x 


2 



1 



X 


1 


X 


3 


+ 2 x 



X + 


1 



X 


X 


+ 2 x 2 + 2 x + 2 


/( 


X 


习题31包含了为什么线性多项式可能是有效的部分 说明； 然而，当次数为 d 的不可 
约多项式的个数超过 2* 时，显然将存在不能由 K ： r ) 的线性选择来进行区分的不可 
约多项式。 

习题30讨论了当 p 二 2 时代替式 （21) 的一个有效方法。 E . Kaltofen 和 V . 
Shoup 发现了当 f 很大时对于不同次数的因子分解的一个更快的 方法； 对于实用大 
小的数运行时间是 O ( 72 2 ■ 5 + ?? 1 + ( log />) 个模 P 下的算术运算，而且当 W 是习题 

4.6.4-66 中的“快速”矩阵乘法的指数和当 72 — ⑺时，是 OU (5 + io + ()/4 log />) 个这样 
的运算。[请见丄 S y mbo//c Comp . 20 (1995)，363 〜 Comp 67 (1998)， 
1179 〜 1197。] 
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历史 注记： 通过首先计算 g ( x ) = gcd ( P _1 - 1，/(工））而后对于任意的 h 计算 
gcdU ( jr)，U + s ) ( W )/2 ± l ) 来求一个无平方多项式 /_(： r ) 模 /) 的所有线性因子的 

思想，是由 A . M . Legendre 给出的 ,Memoires Acad . Sci . ( Paris , 1785 )，484 〜 490; 他 
的动机是求形如 / U ) = 办的 Diophantine 方程的所有整数解，即 /() =0 (modulo 

p )。 体现在算法 D 的更一般的次数分开技术是在公元1800年之前由高斯发现的， 


但未发表[参见他的 Werice 2 (1876) ，237]，而后由 Evariste Galois (伽罗瓦）在创立有 
限域理论的现在成为经典的论文中发现 [Bulletin des Sciences , Mathematiques , 


Physiques et Chimiques 13 (1830) ， 428 〜 435 ; 重印于 c/e Math . Pures et Appliquee 

11(1846) ， 398 〜 407]。 然而，高斯和伽罗瓦的这一成果超越了当时的时代，直到 J 


A.Serret 稍后给出详细的解释 [MSmoires Acad ， Scj \ , series 2,35 ( Paris ,1866)，617 〜 

688; 算法 D 在 § 7 中]之前，它还未被很好地理解。关于把分成为不可约因子 

的一些专门的过程随后由许多作者设计出来，但是在计算机的发明使它们成为合乎 
要求之前，显然还没有发现出对于很大的 A 有效地工作的具有完全一般性的方法。 
带有严格地分析了的运行时间的头一个这样的随机算法是由 E . Berlekamp 发表的 
[ Math . Comp . 24 ( 1970 ) ， 713 〜 735 ] ;它由 Robert T . Moenck [ Math . Comp . 31 
(1977),235-250], M . O . Rabin [ SICOMP 9 (1980) ， 273 〜 280 ] ， D • G . Cantor 和 H ■ 
J . Zassenhaus [ Math . Comp . 36 (1981)，587 〜 592] 所改进和简化 。 Paul Camion 独 al 
地发现了对于多变量多项式的一些特殊情况的推广 [Comptes Rendus Acad . Sci . 
A291 (Paris , 1980 ),479- 482 . IEEE Trans f IT-29 (1983) ， 378 〜 385] 。 

P . Flajdet ， X . Gourdon 和 D . Panario 分析了在模之下分解一个随机多项式所 
需要的平均运算次数 ， Lecture Notes fn Comp . Sci . 1099 (19%)，232 〜 243。 


整数上的因子分解 当我们不是在模 f 之下进行工作时，求整系数多项式的 
完全因子分解要稍微困难些，但是仍有相当有效的方法可用于此目的。 

Isaac Newton 在他的 AWtiimefica Universalis (1707) —书中给出了求整系数多项 

式的线性和二次因子的方法。此方法于1708年被 N . Bernoulli 推广，并在1793年 
被 一 '个名叫 Friedrich von Schubert 的天文学家更明确地加以推广，他说明怎样在有 
限步之内求出次数为 n 的所有因子；见 M . Mignotte 和 D . Stefinescu ，_ Revue ’ Hist . 
Mafh . 7 (2001) ，67 〜 89。大约 90 年后， L . Kronecker 重新独立地发现了 von Schu - 

bert 的方法。不幸的是当 n 是5或更大时，这个方法效率非常之低。借助于上面介 
绍的“模 〆 ’因子分解方法，可以得到好得多的结果。 

假设我们要求整数上一个给定多项式 

u(x) = U n X n + U n .\X n ~ X + + Wo ， 7^ 0 

的不可约因子。作为头一步，我们可以除以系数的最大公因子；这使我们得到一个 
本原多项式。通过像在习题34中那样，剔出 gcd ( u (工） ， w ' ( x )) ， 我们还可以假定 

u ( x ) 是无平方的。 

现在，如果以: r ) = rU ) w (: r )， 其中每一个多项式都有整系数，显然，对于所 

有素数 P ，我们有 u ( jc ) = v ( x ) w ( x ) (modulo p )， 所以除非户整除 / ( w )， 否则有 
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一 个非平凡的模 P 因子分解。因此可以试用分解 Wi ) 模 > 的一个有效方法来重 
新构造整数上的〃 U ) 的可能的因子分解。 

例如设 

u { x ) = j ： 8 + j : 6 - 3 x 4 - 3 x 3 + Sx 2 + lx - 5 (22) 

我们在上面的 （19) 中已经看到 

w ( x ) = ( x 4 +2 > z 3 + 3 x 2 + 4^： + 6)(^ 3 + 8 x 2 + 4 > 2： + 12)( x +3) (modulo 13) 

(23) 

而且 w (： r ) 模2的完全因子分解显出一个6次的因子和另一个2次的因子（见习题 
10)。从 (23) 我们可以看出 ，^(： r ) 没有6次的因子，所以它必然是在整数上不可约 

的。 

这个具体的例子也许太简 单了； 经验表明，通过考察它们模一些素数的因子，大 
多数不可约的多项式都可以用这种方式来加以识别，但是确定不可约性并非总是这 
样容易。例如，有一些多项式对于所有素数/>来说，它们在模 A 之下可以适当地分 
解，而且诸因子具有一致的次数，但在整数上它们却不可约（见习题12)。 

习题38中显示了一大类不可约的多项式，而习题27中证明，几乎所有的多项 
式在整数上不可约。但是我们通常不试图去分解一个随机的多项式；大概总有某种 
原因来预期一个非平凡的因子，否则我们就不会首先有因子分解的企图了。我们需 

要一个方法，当因子存在时它能找到它们。 

一般来说，如果通过考虑在模不同的素数之下 “ U ) 的特性，以求 〃（: O 的诸因 

子，则这些结果将不易于结合在一起。例如如果以 x ) 实际上是4个二次多项式的 

乘积，则将很难把它在不同的素数模之下的映像凑合在一起。因此最好只用一个素 

数，并且看看一旦觉得模这个素数将使诸因子有正确的次数时，我们可以从它得到 

多少好处。 

一个主意是在模一个很大的素数 P 之下进行工作，它足够大，使得在整数上的 
任何真正的因子分解 u { x ) — (: r ) 中的系数实际上必然处于 - p /2 和 p /2 之 

间。于是所有可能的整数因子都可以从模 f 因子读出，而模 P 因子的计算我们是 

知道的。 

习题20说明如何看到关于多项式的系数的相当好的上界。例如如果式 （22) 是 
可约的，则它将有小于等于4次的一个因式 u ( x ) ，而且由该题的结果可知，^的系 
数的绝对值顶多为34。所以如果我们在模任何大于68的素数 f 之下工作，则 
wU ) 的所有可能的因子将是相当明显的。其实，在模71之下的完全因子分解是 

U + 12)“ + 25)(工 2 - 13 _r - l )( x 4 - 24 x 3 - 16工 2 + - 12) 

而且我们立即看到，在整数上这些多项式中没有一个是 （22) 的因子，因为它们的常 
数项不能整除5;而且也不能把两个因子组合在一起而得到 U 2) 的一个因子，因为 
可想见的常数项 12 X 25，12 X ( -7)，12 x ( - 12) 当中没有一个模71同余于± 1或 

士 5 0 

顺便说一句，得到关于多项式因子的系数的好上界并不是轻而易举的，因为当 
多项式相乘时会有大量的项互消。例如，看上去极为普通的多项式 f - 1 有不可约 
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的因子，对无穷多的 n ， 这些因子的系数超过 expU 1/lglg ”）。[见 R . C . Vaughan , 
Michigan Math.]. 21 (1974) ，289〜295。 ] 习题32中讨论了 / - 1 的因子分解。 

如果 w (: c ) 有很大的次数或很大的系数，则素数 f 可能需要极其大，假定“（工） 
在模 f 之下是无平方的，代替使用一个很大的素数我们也可利用小的 P 。 因为 
在这种情况下，称为 Hensel 引理的一个重要的构造可以以独特的方式用来把模 f 
的一个因子分解扩充成为对于任意高的指数 e 在模，下的一个因子分解（见习题 
22)。如果对于户=13和 e = 2, 我们把 Hensel 引理应用于 （23) ，就得到惟一的因子 

分解（模 169)： 

u(x) 三（工 - 36)(x 3 - 18x 2 + 82j ： - 66)(/ + 54j ： 3 - IOjc 2 + 69 工 + 84) 

把这些因子叫做 A ( x ) i ; 3 (: r ) tMU )， 我们看到幻 1( 工）和 w 3 U ) 在整数上都不是 

W U) 的因子，当系数已由模 169 归结到的范围内时，它们的乘积 

%(: r ) z ; 3 ( a :) 也不是 W (: r ) 的因子。因此我们已经穷尽所有的可能性，并且再次证 

明在整数上是不可约的——这次只使用它在模13下的因子分解。 

我们已经考虑的例子在一个重要的方面是不典 型的： 我们一直在对 （22) 中的首 
一 多项式 Wx ) 进行因子分解，所以我们可以假定，它的所有因子都是首一的。但如 
果 〜 >1，我们应当做什么呢？在这样一种情况下，除一个之外，所有多项式因子的 

前导系数都可以在几乎任意的模/之下变化；我们肯定不希望试验所有可能性。 
也许读者已经注意到这个问题了。幸而有一个简单的方法：因子分解 u { x ) = v ( x )^ 
w ( : r ) 意味着因子分解 (: c ) = w (:其中 £( v l ) = ^ ) = u n - £{ u ) o 

(对不起，在我对你的多项式进行因子分解之前，你是否介意我用它的前导系数来乘 
多项式？）我们实际上可以如上边那样进行，但使用 />2 B ， 其中 B 现在是〜以: r ) 

的而不是 的因子的极大系数的上界。 , 

把所有这些发现合在一起就得到以下的过程：！ 

F1. 求惟一的无平方因子分解 

u ( x ) = £( u ) v x { x )-' v r { x ) ( modulo〆 ） 

其中 〆 像上边说明的那样充分大，且 ％( x ) 是首 一 的。（对于大多数素数 
这是可能的，见习题23。）并且置 d^lo 

F2. 对于因子 v ( x ) = v ； ( x ) …％ (: r )， 如果 d = 则^二丄的每一个组合， 

1 d Zr 

构造惟一的多项式 ^( x )=/(^)^(^)( modulo 〆 ），它的系数全都在区间 

-一 1 〆 ，士，)内。如果一)整除，，则输出因子 PP (&))， 用 

这个因子除 u (: c )， 并从模，的因子表撤销对应的％ (： r ); 从 r 中减去撤销 
的因子个数，如果则终止此算法。 


F 3. d 加1，如果则返回 F 2。 I 
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在此过程的结尾， “ U ) 的当前值将是原来给出的多项式的最后 不可约 因子。注意， 
如果 | WQ | < | 〜 | ，则用反序多项式+…+〜（其因子是 w ( x ) 的因子的反序) 
来做所有工作是更可取的。 

所述的这一过程要求妒 >2 B ， 其中 B 是 〜 w (: r ) 的任何因子的系数的界，但如 
果我们仅保证它对次数 <| deg ( w ) 的因子正确，则可以使用小得多的 B 值。在这 


种情况下，每当 deg ( 


> 


2 


)时，步骤 F 2 中的可除性检验应当应用于^ 


X 


(: r ) … v r (x )1 v 


x 


) 而不是 


V { X 




如果我们决定仅仅保证 B 应该限定 “（: c ) 的至少一个真因子的系数，则我们仍 
可以更进一步减少 B 。 （例如，当我们分解一个非素数的 W 而不是一个多项式时， 

某些因子可能是非常大的，但至少有一个将小于等于/ V 。）这个思想是由 B . 
Beauzamy ， V . Trevisan 和 P . S . Wang 提出的 L /. Symbolic Comp . 15 ( 1993),393 

413]， 习题 21 对它作了讨论。在步骤 F 2 中的可除性检验因此必须既应用于 
也应用于 w ( x )， 但是由于通常纩是小得多的，因此计算会更快些。 


上边的算法包含一个明显的瓶颈：我们可能要检验 


r — 1 


因子 


X 


o 


在随机的情况下2〃 的平均值大约是〃，或者也许是 


个那么多的可能的 
n 15 ( 见习题5)，但 


在非随机情况下我们将需要尽可能加速这部分程序。一个快速拋弃虚假因子的方 
法是首先计算尾部的系数5(0)，仅当其整除 / UU (0) 时才继续 进行； 除非此整除 
性条件被满足，否则前一段说明的复杂性可不必考虑，因为甚至当 deg ( z ；) > 

' deg ( u )时，这样一个检验也是正确的。 



加速这个过程的另一个重要的方法是把 r 减小，使得它趋于反映因子的真实个 
数。对于各种小的素数外，上边的不同次数因子分解算法可以应用，这样就对每个 

素数得到了在模岛下诸因子的可能次数之集合 D ;; 见习题26。我们可以把 A 表 

示成一个”个二进位的串。现在我们计算交 n ,即这些二进位串的按位“与”，而 

且仅对 


degG 、） + …+ deg (^) G fl 

才实施步骤 F 2。 其次把选择成有最小 r * 值的九。这技术是 David R . Musser 给出 
的，他的经验提示尝试大约5个素数巧[见 JAQVT 25 (1978),271 〜282]。当然如果 
当前的 flA 表明 z /( x ) 不可约，则我们应当立即停止。 


在 J ACM 22 (1975), 291〜308中， Musser 已经给出类似于上述步骤的一个因 

子分解方法的完整的讨论。步骤 F 1 〜 F 3 结合了由 G.EXollms 于 1978 年提出的改 

进，即在寻找试验的因子时一次取 d 个因子的组合，而不是全部次数 d 的组合。这 

一 改进是重要的，因为在有理数上是不可约的多项式的模 > 的因子具有统计特性 
(参 考习题 37)。 


A . K . Lenstra , H . W . Lenstra ， Jr . 和 L . Lovasz 介绍了他们著名的 “LLL 算法”以 
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便得到关于为分解整数上的一个多项式所需计 算量的严格最 坏情况的上限 [ Math . 
Annalen 261 (1982) ，515〜534 ] 。他们的方法不要求随机数，而且对于次数为 n 的 
w (: c ) 它的运行时间是 0( n 12 + r? 9 (log || u || ) 3 )二进位运算.其中1|在习题20 
中定义^这个估计包括查找一个适当的素数 f 的时间以及用算法 B 求所有在模 p 
之下的因子的时间。当然，在实用中使用随机化的启发式方法运行得显著地更快 

it 匕 

— v 0 

最大公因子 类似的技术可用来计算多项式的最大公 因子： 如果在整数上 

gcd ( 而且 gcd ( u ( x ) , v ( x )) = g (工 ）（ modu[o p ) ，其中 q (工、 

是首 一 ^的，则(: C ) 是 w ( x ) 和 r (: c ) 模户的 一 个公因子，因此 

整除 (modulo p ) (24) 

如果 f 不整除〃和 w 两者的前导系数，则它就不整除^的前导系数；在这种情况 
下， deg ( d )< deg ( c /)。 当对这样一个素数 p . q ( x ) = l 时，我们必定因此有 degU ) 
= 0，及 d ( x ) — gcd ( cont { u ) , cont ( x 0)。 这就论证/ 4.6.1 小节中所作注释，即 
4.6.1-( 6 ) 中 gcd ( ^ (.r ) ， r (:r )) 模13的简单计算足以证明 "（ 工 ） 和^ ) 在整数上 

是互 素的； 算法 4.6.1 E 或算法 4.6.1 C 比较费力的计算是不必要的。由于两个随机 
的本原多项式在整数上几乎总是互素的，而且由习题 4. 6.1-5,因为它们以1 - 1/户 
的概率在模下互素，因此，通常来做模的计算是一个好的想法。 

如以前所解释的那样，对于实践中出现的非随机多项式我们也需要有好的方 
法。因此希望改进我们的技术并且完全以在模素数 P 之下工作所得到的信息为基 
础，发现在整数上一般地如何求 gcd ( u { x ) , v { x )) 0 我们可以假定 〃（: r ) 和 r ;( x ) 是 

本原的。 

代替直接地计算 gcdU (: r )，7； U ))， 去寻找多项式 

d ( jc ) = c - gcd ( u ( x ) , v ( x )) (25) 

是更方便的，其中常数 c 被选择成使 

i ( d ) — gcd (/( u ) ,£( v )) (26) 

对于适当的 c ， 这个条件将总是成立，因为 W (： c ) 和的任何公因子的前导系数 
必定是 gcd (/(“），/( t 0) 的一个因子。一旦已求得满足这些条件的]“），我们就 
可以容易地来计算 pp(S (: r )) ，它是〃（: r ) 和 Wjc ) 的真正的最大公因子。条件 （26) 
是方便的，因为它避免了 gcd 的单位倍数的不确定性；我们实际上已经使用同样的 

思想来控制在分解因子的程序中的前导系数。 _ _ 

如果 p 是一个足够大的素数，基于应用于/(5)〃（：1、）或/(5)^(1)的习题20 

中系数的上限，我们计算所有系数都在 [ 中的惟一 多项式 q { x ) = i ( d ) 

q ( x ) (modulo p ) o ^ pp ( q (: r )) 整除 “（‘r ) 与 r ; (:r ) 两者时，由于 （24) 它必然等于 
gcd ( w (: c )， T ；( a :))。 另 一 方面，如果它不整除 w ( jt ) 与 w (: r ) 两者，必然毛 deg ( g ) 〉 

deg (^) 0 对算法 4.6.1 E 的研究揭示，仅当 p 整除以精确的整数算术通过此算法计 
算的非零余式之一的前导系数时，才有这种 情况； 否则模 p 欧几里得算法和算法 
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4.6.1 E —样精确地处理同样的多项式序列，顶多只差一个非零常数倍数（模/0。 
所以只有少量“倒霉”的素数可以引起我们丟失 gcd ， 但如果我们继续试验就将立即 
找到一个幸运的素数。 

如果系数的上界是如此之大，以致单精度的素数 p 不够用，那么我们可以计算 
5(： r ) 模若干个素数 >，直到它被 4.3.2 小节的中国剩余算法确定为止。这个方法 
已由 W . S . Brown 在 JACM 18 (1971),478-504 中详细作了介绍，它是由 Brown 与 
G . E . Collins 给出的。或者如同 J . Moses 与 D . Y . Y Yun [ Proc . ACM Conf . 28 

(1973) ，159〜 166] 所建议的，我们可以使用 Hensel 方法确定对于充分大 e 的模的 

Hensel 的构造在计算上显得比中国剩余方法要 优越； 但是仅当 

d ( x ) u ( jc 、 Id ( x ) 或 < i ( x ) 丄 (27) 

时它才直接地生效，因为这个想法是把习题22的技术应用于因子分解 £( d ) u ( x ) 

w〆 jc ) 或(: （工 ） （modulo />) 两者之一。习题 34 和 35 表 

明有可能把事情安排成每当需要时 （27) 便成立。（类似于对互素整数所用的符号， 
(2) 中的 

w (: c ) 丄 v ( x ) (28) 

表不 w (: r ) 和 v ( x ) 互素。) 

这里所概述的 gcd 算法要比 4.6.1 节中介绍的那些算法快得多，仅当多项式剩 
余序列非常短时例外。也许最好的一般过程是从模一个相当小的素数^下计算 
gcd “ U )， i ； U )) 开始，而不是从 ^幻和 /(tO 的一个因子开始。如果结果 q(x) 
为1，任务就完成了。如果它有高的次数，我们就用算法 4.6.1 C ; 否则使用上述方法 
之一，首先以 uU ) 和 wU ) 的系数以及以 gU ) (小）的次数为基础计算 S (: r ) 的系 
数的上界。像在因子分解问题中那样，如果尾部系数比前导系数更简单，我们应当 
应用这一过程到 w (: t )， t ； (: r ) 的反序上而后再反序这个结果。 

多变量多项式 类似的技术导致了对于整系数多变量多项式的因子分解或 gcd 
计算的有用算法。通过模不可约多项式 _ h ，…， oc t - a t 处理多项式 w ( a ，…， 

xj 是方便的，这些多项式起着上边讨论中的声的作用。由于 v ( x ) mod ( x ~ a )= 

a ) ，因此 

u(x [ , • • • J X t ) mod I 工 2 — y x t ~ a t 

的值是单变量多项式 uix ^ yaiy ''' , a t ) o 当选定了整数 af ， a t 使得 w (:^，七，…， 
a ,.) 在 q 上有和原来的多项式 w i ，，…， A ) 相同的次数时， Hensel 构造的一个 

适当推广将把这个单变量多项式的无平方因子分解“升高”成模 i (: r 2 _ a 2 ) 〜，…， 
U , - aJM 下的因子分解，其中 n ; 是〃中&的 次数； 同时，我们也可以在模一个适 
当的素数之下进行工作。应当有尽可能多的…为0,以便保持中间结果的稀疏性。 

关于细节，除了早先引用的 Musser 和 Moses 与 Yun 的文章外，还请见 P . S . Wang ， 

Math . Comp . 32(1978) ，1215〜1231。 

从上面引证的先驱性的论文发表以来，已经积累了相当多的计算经验。关于更 
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新情况的综述，请见 R . E . Zippel ， Effective Polynomial Computation (Boston ： Kluwer , 

1993) o 而且，现在有可能分解通过一个“黑箱子”计算程序隐式给出的多项式，即便 
若把输入和输出的多项式明确写出，它们将填满整个宇宙[见 E . Kahofen 和 B . M . 
Trager , J . Symbolic Comp . 9 ( 1990 ) ， 301 〜320; Y . N . Lakshman 和 David 
Saunders ,SJCOMP 24 (1995) ， 387 〜 397 ] 。 

The asymptotically best algorithms frequently turn out 
to be worst on all problems {or which they are used . 

近似地最好的算法经常对于使用它们的所有问题而言是最坏的。 

- D . G . CANTOR and H . ZASSENHAUS ( 1981) 



► 1. [ M 24] 设 /> 是素数，且设 〃（: 0是一个《次的随机多项式，并假定 〆 个首一多项式的每 
一 个都是同等可能的。试证明，如果 72>2， W (_ r ) 有一个在模之下的线性因子的概率介于 （1 + 
p — 和 （2+/ r 2 )/3 之间，含这两个值在内。当时，给出这一概率的一个闭区间形式。线 
性因子的平均个数是多少？ 

► 2. [ M 25] U ) 证明在一个惟一因子分解整环上，任何首一多项式〃 （1) 均可以惟一地表示成 


形式 



其中 W (. r ) 是无平方的（没有形如 d ( x ) 2 的正次数的因子），且 uU ) 和 wU ) 都是首一的。 （ b ) 
( E . R . Berlekamp ) 当 p 为素数时，有多少^次的首一多项式是模 p 无平方的？ 

3. [ M 25] (对于多项式的中国剩余定理） 设 Wl U )， …， w “: r ) 是域 S 上的多项式，且对于所 


有 j 关々， 丄 w ( x )。 对于 S 上任何给定的多项式叫（2)，…，叫（1)，证明 S 上有惟一的多 

项式 r 1 ) ，使得 deg ( v ) deg ( w : ) + …+ deg (〜），且对于 modulo u } 

( x ))。 当 S 是所有整数的集合时，这个结果是否还成立？ 

4. [ HM 2 S ] 设^^是模素数/)的，次数为 n 的首一不可约多项式的个数。求出生成函数 

c p ( z )^ y ：, A ^ 的一个公式。[提示 ：证明 下列幂级数恒等式： /“）= 当且仅当 

g { z )~ 77 ) f ( z n )1 n l a )ip l p n 是多少？ 

5. [ HM 30] 设义^是模素数/)下，随机地选择的《次多项式的因子的平均个数。证明 
A #= H ,,。 当 r 是不可约因子的个数时，1的平均值的极限是多少？ 

6- [ iW 2 J ]( J . L . Lagmnge ，1771) 证明同余式（9)。[提 示：在 />个元素的域中分解:^ - 工。 ] 

7. [ M 22 ] 证明等式（14)。 

8. [ HM 20 ] 怎样才能确保由算法 N 输出的向 M 是线性无关的？ 

9. [20] 给定101的一个原根2,说明如何用一种简单的方式来构造模101的倒数表。 

► 10. [ 21 ] 利用 Berlekamp 过程，求在模2下 （22) 中多项式 w ( x ) 的完全因子分解。 

11.[22] 求在模5下， （21) 中多项式 《(: r ) 的完全因子分解。 

► 12. [ M 22] 对所有素数利用 Berlekamp 算法来确定 W ) = _ r 4 + 1模/>的因子个数。[提 
示：分别考虑二2,/) = 8厶+ 1,户= 8々+ 3，/)二8厶+ 5，/? = 8々+ 7的情况；什么是矩阵 Q ? 你不必 
发现 因子； 仅须确定有多少因子。] 


13. [ M 25] 继续上一题，借助于量 v ^ l ， 乃，一一当这样的平方根在模/>之下存在时, 
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对所有奇素数/)，试给出在模 f 之下 / + 1 的因子的一个明确的公式。 

14 . [ M 2 5 ] ( H . Zassenhaus ) 设 i ^( x ) 是 （8) 的一■个解，并设 u ){ x ) = II (Jr - s )， 其中乘 积是对 

于使得 gcd ( u ( x ), v ( j ：) - 5 )^ 1 的所有 p 取的。说明给定 wU ) 和 r (. r ) 后，如何计箅 
tt .(. x)o [提示 ：等式 （14) 意味着 m ( or ) 是使得 w (:0整除 w ( i ； U )) 的最低多项式。] 

► 15. [, VT 27] (模素数平方根） 试设计一个算法，计算模一个给定素数 P 之下的一个绐定整数 u 
的“平方根，，，即求一个整数 7 ,，只要它存在，就有 I ； 2 = w(modulo p ) o 你的算法应当对于非常大的 參 
素数 p 也能保证效率。（对于这个问题的一个解导致了以通常方式利用二次形式解任何 
给定的模/>二次方程的一个过 程。） 提示：考虑当把本小节的因子分解方法应用于多项式 工 1 -认 

时将发生什么情况。 

16. [ M 30] (有限域）本题的目的是证明 E . Gabis 在1830年引进的域的基本性质。 

a ) 给定 / U .) 是模素数 p 下的不可约”次多项式，证明次数小于”的，个多项式在算术模 
/(、 r ) 和 p 下形成一个域。[注 ：习题 4中证明了每一次数的不可约多项式的存在性；因此对于所 

有素数 p 和所有〃>1，具有，个元素的域存在。] 

b ) 证明具有，个元素的任何域都有一个原根彡，使得这个域的元素是10, 1，$，€，一， 


丨。[提示 ：习题 3.2.1.2-16 提供了在 72-1 的特殊情况下的证明。] 

m — i 丄 

C) 如果 、/’(、 r ) 是模 p 的”次不可约多项式，证明当且仅当⑺是”的倍数时，/ _工可被 
/ X . r ) 整除（由此得出，我们可以稍快地检验不可约性 ••一 个给定的《次多项式 /“） 是模 P 不可约 

的，当且仅当可被/(幻整除而且对于所有整除”的素数9，/— - 丄 / U )。 

17. [ M 23] 设 F 是有13 2 个元素的一个域，对于每个满足1</<13 2 的整数 /， F 中阶数为/ 

的元素有多少？（一个元素 a 的阶数就是 使得， =1的最小正整数 m 0 ) 

► 1.8. [ M 25] 设 《(： r )= “ 〆 +…+ 是具有整系数的本原多项式，并设 W - r ) 是由 

v ( x ) ^ u'\~ l - u ( xlu rl ) = x >: + u n - x jc n ~ l + w „_ 2 w , r r ,/_2 + …+ u 0 u n ~ l 

定义的首一多项式。 （ a ) 若 7;(. r ) 在整数上有完全的因子分解其中每个 pj (工)是 
首一的，问在整数上 u (. r ) 的完全因子分解是什么？ （ b ) 如果 zv { x )^ x m + 丨: c " ;_1 +…+ 

是 U ) 的一个因子，证明对于< "? ,叫是"; r _ 1 ] 的倍数。 

19 . [ M 20 ] ( Eisenstein 准则）也许最有名的整数上不可约多项式类是由 T . Schonemann 在 
Crelle 32 (1846),100 介绍而后由 G . Eisenstein 在 Crel/e 38 (1850),166- 169 上推广 的：设 /> 是素 
数且设 w (.T ). 二 u n x n + ■ ■ * + Uq 有下列性质： （i ) 不被 p 整除； （ U ) _ i ，…， uq 被 p 整除； （ iii ) Wo 

不被 〆 整除。证明〃 （、 r ) 在整数上不可约。 

20. [ HM 33 ] 如果… w 是复数上的任一多项式，设！丨《 II = ( U " | 2 +…+ 


^0 


1 


1/2 


a) 设 《 Cr ) = ( x - a)tt ， （: r) 和 (: l)w (: r )， 其中 ft 是任何复数且^是它的夏共辄 


证明 


u 


v 


b ) 设在复数上 w ( jt ) 的完全因子分解是 u } ，（x — a 


m 響 


X 


d 


MU) 


a 


n 





max( 1 ， 


A 


证明 M ( u )< u s i c 

c ) 证明对于0<』<72，1〜丨 ^ M ( u ) + 

d ) 把这些结果合在一起以证明如果 U ( x ) = V 



w ' _ 1 

(x) w(x)R v(x 


= V ) yl X m + •*■ + 幻0,其中 w ， 
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都有整系数，则 r 的系数以 


为界。 




U 



21 . [ HM 32 ] 继续习题20,我们将推导在整数上的多变量多项式因子的系数的有用的上界。 
为方便起见，我们将用黑体字母 表示/ 个整数的序列。因此，代替 



我们将简单 地写以 x ) = SjKjjr 1 。 注意对于 d 的 约定； 我们也写 j ! …^!和二^ 



a ) 证明恒等式 



S" S [P + S 二 2 [q + r = ^ b H C T 

i^O p.s^O q« r^O 

b ) 多项式 w ( x )= SjZ/jd 称为 n 次 齐次的 ，如果每项有 n 的总 次数； 于是每当 u ^ O 时 Sj 二 
”。考虑系数的加权和 B ( u )= Sjj ! | Uj | 2 。 使用 a ) 证明，每当 w ( x ) = Wx ) w ( x ) 是齐次的时， 
B ( u )^ B ( v ) B (- w)o 


c ) 当 W 是《次齐次时，一个多项式 W ( x ) 的 Bombierl 范式 [ « ] 定义为7 B “ ）/ n !。对于非齐 
次多项式也可定义它，办法是增加一个新变量 x / + l 并且以心 +1 的幂来乘每一项，使得《变成为齐 

次的而不增加它的极大次数。例如，设 wU ) =4/ + o : - 2;对应的齐次多项式是4/ + _ 

2/ ，因而我们有[“] 2 = (3! 0! 4 2 + 1! 2! 1 2 + 0! 3! 2 2 )/3! =16+ + + 4。 如果 u ( x . y ^ z ) - 


3： o , 3 - z 2 , 类似地我们有 h ] 2 = (1! 3! 0! 0! 3 2 +0! 0! 2! 2! 1 2 )/4!=冬 +士。当 “（ x ) 二 w ( x )- 

4 D 

切卜)日+，关于[〃]，^]和[^]之间的关系，13)告诉我们什么？ 

d ) 证明如果 uU ) 是一个变 M 的^次可约多项式，它有其系数的绝对值顶多是 n \^[ u] m l 
U /4)! 的一个因子。问 f 个变量的齐次多项式对应的结果是什么？ 

e ) 当 i /( x ) - ( a : 2 - 1) ,; 时，明确地和近似地计算 [ w ]。 

0证明[“] [ r ]>[ ⑽]。 

g ) 证 明：当 aU ) 是一个 rz 次多项式而 MU ) 是习题20中定义的量时， 

2- ull M(u) < [ w] ^ 2 , ， n M(u) 

(因此 d ) 的上限粗略地是在该题中我们得到的上限的平方根。） 

V 22 .[ M 24 ] ( Hensel 引理）设《 U ) ，，叫 U ) ， a ( x ) ，6(工）是具有整系数的多项式，并满 

足关系式 


u ( x ) = v p ( jo ) w ^( x ) (modulo p e ) 
a { x ) v e { x ) + b { x ) iu e { x ) = 1 (modulo p ) 

其中/ > 是素数 , e ^\ ， i ^(. r ) 是首一的 ydegia )< deg ( zt > e ) ， degO ) < deg ( r ; e ), deg ( u ) - deg ( v e ) + 
deg (叫）。说明当 e 增 1 时怎样计算满足同样条件的多项式％ +1 ( 1 )三％(： 0 和 = 
u V U ) (modulo ，）。而且证明在模 ， +1 下，〜丨（工）和 t % +1 U _) 是惟一的。 

由在习题10中求出的在模2下 （22) 的因子分解开始，对 p = 2使用你的方法证明 （22) 是整 
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数上不可约的（注意欧几里得扩充算法，习题 4.6.1-3 将从 e = l 开始这个过程）。 

23. [ HM 23] 设是整系数的无平方多项式。证明仅有有限多个素数使得 u ( x ) 不是模 

p 无平方的。 

24. [ M 20] 正文仅谈及整数上的因子分解，而没有谈及有理数上的因子分解。请说明怎样在 

有理数域上求有理系数的一个多项式的完全因子分解。 

25. [ M 25 ] 在有理数域上，什么是^: 5 + x 4 + x 2 + x + 2 的完全因子分解？ 

26. [20] 设 ，…， d r 是模 p 之下 u (、 r ) 的不可约因子的次数，各以适当的重数出现，使得 

d n + …+ d r = n ~ deg ( u) 0 说明怎样通过对长度为〃的二进位串执行 ◦(〃） 个操作，计算集合 

| deg ( w)l 对于某个 v{x) yTJo(x) , u(x) = v{jc) vo{x) ( modulo / ) 1 。 

21.{ HM 30] 证明在某种适当的意义下，整数上的一个随机本原多项式“几乎总是”不可约 


的。 

28. [ M 25] 当对于每个次数 d 至多有一个不可约多项式时不同次数的因子分解过程是“幸运 
的”； 此时完全不需要把&(: O 分解因子。当 p — ⑺时，对于固定的《，在模 p 下分解一个^次随 


机多项式时，这样一种走运的情况的概率是多少？ 

29. [ M 22] 设 g (: r ) 是在模一个奇素数 p 下，两个或多个次数为 d 的不同不可约多项式的乘 
积。证明•.当 t (: cW 、 模 P 下次数小于 2 d 的 p 2 " 个多项式中随机地选择时，对任何固定的 g ( x 、， 

— 1)/2 -1)将是貧 U ) 的真因子的概率大于等于 ll 2_ ll (2 p 2d ) 0 

30. [ M 25] 证明如果 g ( x ) 是模 p 下次数为 d 的一个不可约多项式，而且 zU ) 是任意的多项 

式，贝 !] (r (: r ) 十 Z p + r ( x ) ^ +…+ r ( 1 A ) mod g (:c ) 的值是一个整数（即次数 <0的一个多 
项式）。利用这一事实，设计在 P -2 的情况下，分解类似于 （21) 的 d 次不可约多项式的乘积 
心 U ) 的一个随机化算法。 

31. [ HM 30] 设/>是奇素数且设证明存在一个数 n ( p ， d )， 它有以下两个性质 ：（ i ) 对 

所有整数 f ，在模下恰有 n ( p ， d ) 个 d 次不可约多项式 i ) 满足 （x + t) ip 0/2 mod q ( x ) = 1 0 
( ii ) 对所有整数 < ; 2 < />，在模 p 下恰有 n ( p ， d 竹 d 次不可约多项式 g ( x ) 满足 U 十 


t'Y p " 0/2 mod q(x) = (x + t 2 ) (p ~ 0/2 mod <?( 工）。 

► 32. [ iW 30] (循环多项式） 设氺, ,（: r ) = — 以），其中 〜 = e 2 W '于是，氺” U ) 的 

根是单位的复77次根，对于 ? n 〈 n 它不是 w 次根， 

a ) 证明市，, U ) 是一个整系数多项式，而且 

，” — ；！ = 工）； = 11(? _ 1) 〆 ，""） 

d \ n ti \ n 

(参考习题 4.5.2-10 b ) 及 4.5.3-28 c ) o ) 

b ) 证明少„(工）是整数上的不可约多项式，因此上述公式是整数上 / - 1 的完全因子分解。 

[提示 ：如果 /( x ) 是整数上氺 (. r ) 的一个不可约因子，且？是使/(?)=0的一个复数。证明对所 
有不整除 n 的素数使用下列事实可能是有帮助的，对所有这样的素数，在模下， 
x n - 1是无平方的。] 

C ) 讨论 少， 的计算，而且对于77<15把这些值造成表。 

33. [Ml 8] 真或假：如果 "（ x )^0, 且 w ( jc ) 模户的完全因子分解是 ( i / i …(: c )' ，贝 1 J 


u (.r )/ gcd ( u ( jc 、， u '( jc 、）= o 

► 34, [ M 25] (无平方因子分解） 显然，一个惟一因子分解整环的任何本原多项式都可表达成形 
式 ll ( x ) — （: C )«2( X ) 2 W 3(- T ) 3 〜 ，其中多项式 W ,. ( X )是无平方的且彼此互素。这个表不除单位 



• 420 


4.6 多项式算术 


的倍数外是惟一的，其中 u , U ) 是恰恰_；次整除〃（: r ) 的所有不可约多项式的 乘积； 而且，它是表 

示那些参与乘法、除法及 gcd 运算的多项式的有用的方法。 

设 GCD ( u ( jc ) , r ( x )) 是生成三个答案 

GCD ( u(x) , v{x)) = (d(x) , u{x)i d{x) ,v{x)id{x)) 

的一个过程，其中 d (_ x )= g C d (以等式 （25) 下边的正文中所描述的取模方法总是以 

和 rU )/ d (： r ) 的试除结束，以确保没有使用“倒霉的素数”，所以量 W U ') MU ) 和 
z ; (.r )/d () 是 gcd 计算的副产品。于是当我们使用取模法时，实质上可以像计算 gc6(u (x) , 
z ; (: r )) 那样快地计算 GCD ( u (. r ) , v ( x )) 0 

试设计一个过程，它得到整数上一个给定本原多项式〃.（幻的无平方表示（^(0；)^ 2 (；0, 
…）。你的算法应当恰恰执行 e 次 GCD 的计算，其中 e 是使关1的最大下标，而且每个 GCD 
计算都应满足 （27) ，以便能使用 Hensei 构造。 

35. [ M 22]( D . Y . Y . Yun ) 试设计一个算法，给定以工）和 u ( ^ ) 的无平方表示 （u i U ) ， 
w 2 (* r )， …)及（。 1 (： 0 ， 1 ； 2 (工），…），它计算整数上 zv (x) ^ gcd (u ( x ) , r (_ x )) 的无平方表示 

(u； ! c ) ， W2 ( 工 ) ，…)。 

36. [ M 27] 推广习题34的过程，使得当系数算术是在模 p 下进行时，它将得到一个给定多项 
式 w (: r ) 的无平方表示 （ 仏 （: c ) ， u 2 (. r ) ，…）。 

37. [ HM 24] (George E . Collins ) 设心，…，尤是和为 n 的正整数，并设 p 为素数。当在模 p 
之下，一个 n 次随机整多项式 w (: c ) 完全分解时，它的不可约因子有次数 …， d r 的概率是多 
少？证明这个概率渐近地和77个元索的一个随机排列有长 度为心 ，…， d r 的循环之概率相同。 

38. [ HM 27] (Peirori 准则） 设 w U ) 二/+〜_ , /_ 1 +…+ ^是具有整系数且使得 

以及或者 | w „ — 丨 |>1+ | - 2 I + …+ | “ 0 | 或者 （ W ，,- 丨 = 0且 一 2〉1 + I 、 - 3 I + …+ I w 0 I ) 的—个 

多项式。证明 "（ X ) 在整数上是不可约的。[提 示： 证明几乎所有 U 的根的绝对值都小于1。] 

39. [ HM 42 ](David G . Cantor ) 证明如果多项式 w U ) 是在整数上不可约的，在其不可约性证 
明中二进位的个数至多是 deg ( u ) 和系数的长度的多项式，则在此意义下它有一个不可约性的“简 
明的”证明。（如同在习题 4.5.4-17 —样，这里要求的仅仅是证明的长度的上限，而不是为求这样 
一个证明所需要的时间的上限。）提示 ：如果 是不可约的而且 Z 是整数上的任何多项式，则 

的所有因子都有大于等于 degU ) 的次数。 Perron 准则提供了大量的不可约多项式 

► 40.[ M 20]( P . S . Wang ) 如果心是 u ( x ) 的前导系数和 B 是^的某个因子的系数的上限，正 

文的因子分解算法要求我们在模，之下分解一个因子，其中 p e >2 但当 B 是由习题21 

的方法选定的时， 1〜1 可能比 B 还大。证明如果是可约的，则通过使用习题 4.5.3-51 的算 

法，每当时，存在一个方法从在模，之下的一个因子恢复它真正的因子之一。 

4 l ,[ iW 47]( B eauza my ， Trevi san 和 Wang ) 证明或反驳 ：有一 个常数 r ， 使得如果 / U ) 是任意 
的整数多项式且其所有系数的绝对值小于等于5,则它的不可约因子之一有以 cB 为界的系数。 

4.6.3 求幂值 

在这一小节中我们将研究有效地计算/的有趣问题，: T 和〃是给定的，其中 W 
是正整数。例如，假定要计算： r 16 ; 我们可以简单地由： r 开始并且乘以 x 十五次 c 
但是如果我们反复地取每一部分结果的平方，逐次形成：^ 2 ,2 4 ，1 8 ，/ 6 ，则有可能仅 


使用四次乘法就得到相同的答案。 

一 般来说，同样的思想可以如下的方式应用于任何 n 值 ：以二 进制数系来写^ 
(去掉左边的零 h 然后以字母对 SX 代替每个“1”，以 S 代替每个 “0”， 而且划掉现在 


在左边出现的 “SX 
果就成为计算 X ” 


o 


如果 “ S ” 解释为平方运算，“ X ”解释为乘以 I 的运算，则这个结 


的 


个规则。例如，如果 n 


23,则它的 


进制表 7 K 是10111;所以 


我们构造 SX S SX SX SX ， 并删去前导的 SX 而得到规则 SSXSXSX 


这个规则指出 


了我们应该“平方，平方，乘以 
计算 X 2 J X 4 y X 5 y y X [[ , 



，平方，乘以 



，平方，乘以 



换言之，我们将逐次 



23 


通过考虑计算中的指数序列，不难论证这一“二进方法”：如果我们重新把 “s” 解 
释为乘以2的运算，并把“ X ”解释为加1的运算，而且如果我们以1而不是以 I 开 

始，由于二进制数系的性质，这一规则将导出 n 的计算。这个方法是十分古老的，公 
元前200年它就出现于 Pifigala 的印度经典著作 CiiandA - SLitra 中[见 B . Datta 和 A . 

N . Singh , History of Hindu Mathematics 2 ( Lahore : Motilal Banarsi Das ，1935) ， 76 ] 。 

在其后的一千多年间，似乎在印度之外没有人提及这个方法，但在公元 952 年大马 


士革的 al - Uqlldisi 给岀了对于任意 



怎样有效地计算2” 的清晰的 讨论； 见 A . S . 


Saidan ^ T/ie Arithmetic of ai-Uqlidii ( Dordrecht : D . Reidel ,1975)，341 




342,其中对 



= 51 说明了一般的思想 c 
编译 （ London : 1879) , 132 


也见 q \\ d \ s \ y Chronology of Ancient Nations f E . Sac ha u 

-136; 这部 1] 世纪的阿拉伯著作曾产生巨大的影响。 


用于得到 



n 的这个 S 和 X 的二进方法，除了： r 和当前的部分结果外并不需要 


临时存储，所以它很适合于放人一台二进制计算机的硬件中。这个方法很容易编成 
程序； 但它要求自左至右地扫描 n 的二进表示。计算机程序一般喜欢以另一个方向 
进行，因为可用的除以2和模2剩余的运算都将推出从右至左的二进表示。因此， 
基于自右至左地对数进行扫描为基础的下列算法，通常是更为方 便的： 


算法 A (指数的自右至左的二进方法) 


这一算法计算 



'其中72是正整数 


C 


(这里： T 属于任何代数系统，其中已经定义了一个可结合乘法，并有么元1。) 



参 


图13 


的求值，以对〃的二进制表示自右至左地进行 


扫描为基础 


A 1 •[初始化]置 


n 、 Y —1 ，Z 



A 2 .[N 折半](这时，我们有/= Y 2 




)置 N 


LN /2」， 同时确定 iV 是偶数还 
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是奇数。若 iV 是偶，则跳到 A 5。 

A 3.[ Y 乘以置 Y — Z 乘 V 。 

A 4 .[N = 0?] 如果 iV = 0 则算法终止，且 Y 是答案 
A 5 •[平方 Z ] 置 Z 乘并返回步骤 A 2。 ■ 

作为算法 A 的一个例子，考虑在计算 Z 23 中的 步骤: 



N 

步骤 A 1 后 

23 

步骤 A 5 后 

11 

步骤 A 5 后 

5 

步骤 A 5 后 

2 

步骤 A 5 后 

1 

步骤 A 4 后 

0 


Y 







Z 







16 


对应于算法 A 的一个 MIX 程序见习题2。 

伟大的计算家 a 卜 Kashi 在公元1427年就指出了算法 Af Istoriko ^ Mat . 
Issledovaniia 1 (1954) ，256〜257 ] 。这个算法同埃及数学家早在公元前2000年实 
际使用的乘法过程有密切 关系； 因为如果我们把步骤 A 3 改成“ Y — Z ”， 步骤 
A 5 改成 “ Z—Z + Z ”， 而且我们把 Y 置成0以代替步骤 A 1 中的置成1，则此算法就 

以 Y = n:c 终止。[见 A . B . Chace,The Rhind Mathematical Papyrus (1927) ； W . W . 
Struve , Que/Ien und Studien zur Geschichte der Mathematik A 1 (1930) 。 ] 这是手算乘 

法的一个实用方法，因为它仅仅包含简单的加法、折半和相加的运算。通常把它叫 
做乘法的“俄国农民方法”，因为19世纪时西方访问者在俄国发现俄国农民广泛使 
用这个方法。 

算法 A 所需要的乘法次数为 

Llg /2」+ v ( n ) 

其中 〆 72) 是；？的二进表示中1的个数。这比在本节开始时提出的自左到右的二进 
方法只多做一次乘法，因为这里第一次执行步骤 A 3 时只不过是做乘以1的乘法。 

由于这个算法要求簿记时间，故二进方法对于小的7?值，比如说，〃<10,通常 
并没有价值，除非做一次乘法需要相当长的时间。如果预先知道 n 的值，则自左至 
右的二进方法是可取的。在某些情况下，例如 4.6.2 小节中讨论的 mod w ( jc ) 的 
计算，乘以 x 要比进行一般的乘法或者对一个值求平方容易得多，故在这种情况下 
对于指数的二进方法主要适合于十分大的72。当77大于计算机字长时，如果我们希 
望计算/的精确的多精度的值，除非72是如此之大，以致要使用 4.3. 3小节的高速 
乘法程序，否则二进方法毫无 帮助； 而这样的应用是很少的。类似地，二进方法通常 
也不适宜于对一个多项式作乘方，关于多项式指数的广泛著作的讨论，见 R . J . 


黪 
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Fateman , S/COMP 3 (1974) ，196〜213。 

这些评述的要点在于，二进方法是很好的，但不是万灵药。当相乘的时 
间实质上与 ； 和々无关时（例如，对于浮点乘法，或模 m 乘法）它们最 适用； 在这种情 
况下，运行时间从阶72减少成阶 log 72。 

更少的乘法 若干作者断言（没有证明）二进方法实际上给出了可能的最小的 
乘法数，但这是不对的。最小的反例是 n = 15,这时二进方法做6次乘法，然而我们 
可以以两次乘法计算 y = : r 3 , 并且以另外的三次计算： = 即仅仅用五次乘法就 
达到所求结果。现在让我们讨论用于计算/的其它某些过程，并假定77是预先知 
道的。这样的过程是有意义的，例如，当一个优化的编译程序生成机器代码时。 

因子方 法是以 n 的因子分解为基础的。如果 u = 其中是 n 的最小素因 
子，而且9>1，则我们可以首先计算/而后对这个量作乘方到次幂来计算 
如果 n 为素数，则我们可以计算：并乘以： r 。 当然，如果 77 = 1，我们全然无须进 
行计算。对于任何给定的〃，反复应用这些规则，就可完成计算/的过程。例如， 
如果我们要计算 I 55 ,我们首先计算 y = ^ = = 然后我们构造 y 1 二 

整个过程需要8个乘法，而二进方法需要9个。平均说来，因子方 
法比二进方法更好些，但是也有一些情况 （ n = 33是最小的例子），其中二进方法优 
于因子方法。 

二进方法以推广到 w 进方法 如下：设 n = d 0 m 1 + i m ' 1 +…+ 4 ，其中对 
于这个计算以构造^，^，^，…，，叫开始。（实际上，仅仅需 
要使七出现在72的表示中的幂注意到这一点通常可节省一些工作量。）然后对 
作乘方到 m 次幂，并乘以/ 1; 我们已经计算出 a = + 其次，对％作乘 

方到 m 次幂，并乘以得到 y 2 = x d y + d ^ l + d 2 Q 这样继续进行这一过程直到算 

出 y , = ? 为止。每当4 = 0时，它当然不需要乘以注意，当 m 二2时，这个方 

法归纳为早先讨论的自左至右的二进方法。还有一个不太明显的自右至左的 m 进 
方法，它花费更多的内存但只增加了不多的步数（见习题9)。如果 m 是一个小素 
数，当诸系数作模 m 处理时， m 进方法对于计算一个多项式在模另一个多项式之 
下的乘方特别有效（见等式 4.6. 2-(5))。 

图14中示出了对于所有比较小的72值（特别是对于实际应用中出现的大多数 
n )， 只需要最少的乘法次数的一个系统的方法。为了计算/，先在这棵树中找到 
n ， 于是从根到〃的通路指出在/的有效计算中岀现的指数序列。生成这棵“幂 
树”的规则见习题5。计算机检验已经表明，对于图中列出的所有 n 值，这棵幂树都 
给出最优的结果。但对于充分大的77值，幂树方法并不总是最 优的； 最小的例子是 

n =77，154,233。 幂树既优于二进方法也优于因子方法的第一个情况是^ = 23。因 

■ 

子方法超过幂树方法的第一种情况是 n = 19879 = 103 *193; 这样的情况是十分罕见 
的。（对于72<100 000,幂树方法好于因子方法88 803 次； 打平11 191 次； 失利仅6 
次。） 
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图14 “ 幂树” 

加法链 通过乘法计算/的最经济的方式，是一个具有有趣历史的数学问题 Q 
我们现在将详细地考察它，这不仅因为它本身是有趣的，而且还因为它是研究“最优 
计算方法”时遇到的理论问题的一个突出例子。 

尽管我们涉及的是： r 的幂的乘法，但是这个问题可以很容易地归结为加法，因 
为指数可以相加。这导致下列的抽象 表述： n 的一 个加法 链是整数序列 

1 二 a 0 ，…， a 2 ，…， a r = n (1) 

它具有下列性 质：对 于所有；=1，2，"、「，对于某个 k ^ j < i. y 

a L = a 〕 十 a k (2) 

考察这个定义的一个途径是考虑一台简单的计算机，它有一个累加器，并有三个运 
算符 LDA ， STA 和 ADD ; 机器开工时在它的累加器中有数1，它通过把以前的结果加在 
一起来计算数注意，^必须等于2,而〜是2,3或4。 

以 /(72) 表示存在的72的加法链的最小长度 r ， 则/( I ) =0，/(2) = 1，/(3)= 
/(4)=2,等等。本小节的剩下部分就是要尽可能地多发现关于这个函数的性质。 
图15以树形显示了对于小 rz 的 ZU ) 值，它表明对于所有 n <100, 怎样以最少的乘 
法计算： c ” 。 

确定/ ( n ) 的问题看来首先是由 H . Dellac 于1894年提出的，而由 E.de 
Jonquieres 给出的 一 '个部分解提到了 因子 方法[见 JL InteimSdiaire des Mathematiciens 
1(1894) ， 20 ， 162 〜 164] 。在 de Jonquieres 的解中，他列出了对于所有素数 /?< 200 
他所认为 /( p ) 的值，但是对于 p = 107,149,163,179,他的表值高出1。 

因子方法立即告诉我们 

I ( mn ) ^ L ( m ) + / (??) (3) 

因为我1门可以取链1 ，，…， a r = 和1 , 6] , n ，并构造链1， a ! ，…，， 
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19 28 21 22 23 40 27 30 25 48 26 34 36 33 64 

I 八八 II 八八八 I 八八八八八 I 

38 29 56 31 42 44 46 41 80 39 54 45 60 50 51 96 35 52 43 68 37 72 49 66 65 

I I /\ I I I A I A I II A II /\ II /\ MINI 

76 58 57 59 62 84 88 47 92 82 83 85 78 55 90 63 75 100 53 97 99 70 61 77 86 69 74 73 98 67 81 


89 94 93 95 79 91 71 87 

图 U 对〃<100,最小化乘法次数的树 


a r b\ ， ••• ， a r b s = mn 0 

我们也可以把 W 进方法加到加法链的术语中去。考虑 777=2+ 的情况，并以 777 

进数系写 n = do rri ■(- + … 十 A ;对 应的加法链具有形式 

1,2,3, 4 * * , — 2,772 — 1 

2d 0 ,4d 0 , …， ind q ， md o + d] 

2( mdo + d v ) ,4( md Q + L ),*•*, m ( md^ + ^! ) , m 2 + md Y + ， 

…， 7?? Wo + 7 ?〆 _ 1 ^ } … < (4) 

这个链的长度是 w — 2 + (k + l)z; 而且通过消去未出现诸系数 4 的头一^行的某些 

元素，加上头一行中已经出现的 24 ， 4 心， … 当中的一些元素，通常它还可以缩短。 

每当数字 < 为 0 时，相应行右端的步骤当然可以中止。而且，正如 E.G.Thurber 已 

经发现的 [Duke 40 (1973) ， 907 〜 913] ，如果我们提前 e 步把形如 </2 e 的 

值投入计算，我们就可省略头一行中所有的偶数（除 2 以外）。 

当 — 般方案⑷简化成本小节开始处提到的 “S” 和 “X” 规则时， m 进方法最简单 
的情况是二进方法 （m =2): 对于 2 〃 来说，二进加法链是对于 n 的二进链后边跟以 
2n ; 对于 + 1 来说，它是的二进链后边跟以 2n + 1 。由二进方法我们得出如 

下结论 •. 


/(2 e « + 2' + …+ 2') < ^ 如果 a > 〜 > … > 〜 >0 (5) 

为了下边讨论方便，现在我们定义两个辅助 函数： 

A ( ” ） = LU (6) 

An ) =在72的二进表示中1的个数 (7) 

于是 A ( i 7)=4， v (17) = 2; 这些函数可以由递推关系 定义： 
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A ( 1 ) = 0 ; X{2n) — A ( 2 ?7 + 1 ) = X(n) 1 (8) 

v (1) = 1 ? v{2n) = v(n) , v(2?/ + 1) = p(") + 丄 (9) 

用 这些函数来表示，〃的二进加法链恰要求 A ( n ) + -1 步，而且 （5) 变成 

/ ( ；/ ) ^ A ( ?? ) + V ( ) - 1 (10) 

特殊的链类 不失任何一般性，我们可以假设 ，一 个加法链是递 升的： 

丄 = <2 0 <Ul<a2<".<a r = n (11) 


因为如果任何两个 a 相等，则它们之一就可以 丟掉； 而且我们也可以把序列 （1) 重新 
安排成递升顺序并删去大于 n 的项而不破坏加法链的性质（2 )。从现在起我们将只 
考虑递升链而不明确地提出这个假定。 

这时定义一些关于加法链的特别术语是方便的。由定义，对于对于 
某个 ； 和我们有 

Uj — a ; + aj. (12) 

如果这个关系对于多于一对的成立，我们就令7尽可能地大。如果 j = k = 
/- I ，我们就说 （ il ) 的步骤 z 是 加倍； 于是化有可以跟在递增的链1，以，…，〜- 

后的极大值2^.1。如果 j (但不必是幻等于7 -1，我们就说步骤 z 是一个星步。 

下面要说明星步的重要性。最后如果 A ( a ; .) = A (~ M ) ，我们就说步骤 z 是一个小 

步。由于屮― 〆 〜‘]〜- 】， 量 A (心）总是等于 A ( n ) + 1;由此得出，在 

任何链 （ 11 ) 中，长度 r 等于 A U ) 加上小步的个数。 

在这些步型之间有若干初等关系成立 ：步骤 1总是一个加倍 ，一 个加倍显然是 
一个星步，但绝不是一个小步。一个加倍后边必须跟着一个星步。而且如果步 z 不 
是 一 个小步，则步 i + 1或者是 一 个小步或者是 一 个星步，或者同为两者；换句话说， 
如果步/ + 1既不是小步也不是星步，则步 Z 必然是小步。 

一个星链是仅含有星步的一个加法链。这意味着每项 a , 是和以前的一个 

a k 之和； 上边等式 (2) 之后讨论的简单“计算机”在一个星链中只利用两个操作 STA 

和 ADD (而不是 LDA ), 因为这序列的每个新的项利用累加器中以前的结果。至今我 
们已经讨论的大多数加法链都是星链。^的一个星链的极小长度以 ru ) 表示； 显 
然 

l { n ) ^ I " ( n ) (13) 

我们现在准备来推导关于加法链的…邱不平凡的事实。首先我们可以证明，如果 r 
离 A ( 77 ) 不远，则必定存在相当多的加倍。 

定理 A 如果加法链 （11) 包括 d 个加倍和 r - d 个非加倍，则 

71 <2^- 1 F /+ 3 ( H ) 

证明对 r = d + / 用归纳法，当1时我们看到 （14) 肯定是真的。当 r>l 
时，有三种 情况： 如果步 r 是一个加倍，则+ 〃 = _ 2 戶 / + 3 ;因此得岀（14)。 
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如果步 r 和 r - i 都非加倍，则因此由斐波那 

契序列的定义十 a r . 2 <2 d - { ( F f+2 + ? /+1 )=2以-、 3 。 最后，如果 

步 r 不是一个加倍但步 r _ 1是 一 个加倍，则 2 F / + 2 且 a = a r ^ a r - { + 
〜 — 2 = 3〜 — 2 。现在 2 F /+3 - 3 F f + 1 = F /+1 - F / X ); 因此在所有情况下 n <2 d ] 

F /+3。 I 

我们使用的证明方法表明不等式 （14) 在所述假定下是“最好 的”； 加法链 

l ,2,*-*,2^ I ,2^ l F 3,2^ 1 F 4 ,*-*,2^ 1 F /+ 3 (15) 

有 d 个加倍和/个非加倍。 

推论 如果加法链 ( 11 ) 包括/ 个非加倍和 s 个小步，则 

S </< 3.2715 (16) 

证明显然，.、</。我们有 2 A ( rt )< n <2 d — 

d + /= A ( r /) + 6 •，而且因为当 />0时，因此0<5 In 2 + /1 W 2)， 由 
事实 In 2 / ln (2/ cf >)^3.2706 得出（16)。 | 

对于特殊《的 ZU ) 值用归纳法容易证明~<2 ; ，因此在任何加法链 （11) 中 
ig n ^ r 0 因此 

l { n ) ^flg nl (17) 

这一下界，连同由二进方法给出的上界 （10) — 起，给了我们值 

/(2 A ) = A (18) 

l (2 A + 2 b ) = A + 1， 如果 A > B (19) 

换句话说，当 〃 U )<2 时，二进方法是最优的。通过某些进一步的计算，我们可以 

把这些公式推广到 v ( n ) = 3 的 情况： 

定理 B 如果 A > B > C ， 则 

l (2 A +2 b + 2 C ) = A + 2 (20) 

证明事实上，我们可以证明一个更强的结果，我们在本节后面还要用到 它:所 
有恰恰含有一个小步的加法链必有下列六种类型之一（其中所有以“…”表示的步都 
表示加倍）： 

类型 1 1，"'，2 a ，2 a +2'. h ，2 a+c + 2 s+c ; A > B >0, C >0 

类型2 1，〜，2 A ，2 A + 2 S ，2 A + 1 +2 5 ，."，2 A + C +1 +2 S + C ; A > JB ^0, O 0 

类型 3 1，…， 2 A ，2 A + 2 A — 1 ，2 A + 2 , …， 2 A + C ; A >0, 02 
类型 4 1，…， 2 a ，2 a +2 a '2 a + 1 +2 a ，2 a + V "，2 a + c ; A >0, 02 

类型 5 lr "，2\2 A +2 A — 1 ，...，2 A + c + 2 A + c — 1 ，2 A + c +1 +2 A + c — 2 ，."， 

2 a + c + d + i + 2 a + c+d - 2 ;a > 0 ， c>0, D>0 

类型 6 1，… ，2 a ，2 a +2 s ，2 a + 、 …， 2 a + c ; A > B > Q , C >{ 

直截了当的手算表明，这六种类型已包括了所有的可能性。由定理 A 的推论可 
知，当有一个小步时，至多有三个非 加倍； 这极大值仅在类型3的序列中才会岀现。 
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上边所有类型都是星链，只有当 B < A~l 时的类型6除外。 

现在从下列观察 

/(2 a 十 2 s 十十2 

和 /(2 A +2 S +2 C )& 定大于 A 十1，即可得到定理，因为六个可能的类型没有一个有 
V ( 72 ) 〉2成立。 | - 

( E . de J onquiSres 于 1894年未加证明指出，当 时 l { n )^- X { n ) + 2 0 

定理 B 的头一个公开的证明是由 A . A . Gk ) ia ， M . V . Subbarao 和 M . Sugunamma 给出 

的 ， JSDuice Math . J . 29 (1962) ，481 〜487。) 

当 A > B > C > D 时，就要更多地涉及 /(2 A +2 B +2 c + 2 D ) Mi +» o 通过二进 
方法，它至多是 A + 3,而由定理 B 的证明，它至少是 A +2。 A + 2的值是可能的， 
因为我们知道当^ = 15或77 = 23时，二进方法不是最优的。现在我们将看到，当 

vU ) = 4 时，它的完整特性是可确定的。 

定理 C 如果 v ( n )>4, 则 + 3, 只有当 A > B > C>D 和 l (2 A + 

2 s + 2 C + 2 D ) 等于 A + 2时的 T 列倩况例外： 

情况 1 A-B = C~D (例子 ：n = 15) 

情况2 A-B = C-D + 1 (例子 ： 72 =23) 

情况3 A -B = 3, C-D = 1 (例 子 ： n =39) 

情况4 A - B =5, E - C = C-D = 1 (例子 ： /z = 135) 

证明当 / ( n ) = A ( n ) + 2 时，有 一 个恰有两个小步的”的加法链。这样 一 个 
加法链在定理 B 的证明中从六个加法链之一着手，后跟一个小步，再后跟一系列非 
小步。如果对于定理 B 中所列的四种情况 之一， == 2 A + 2 B 十 2 C + 2 D ，则我们说” 
是“特殊的”。如同习题13中所示，对于每个特定的〃，我们可以得到所要求形式的 
加 法链； 因此，剩下的只是证明，除非 A 是特殊的，否则在恰有两个小步的链中，不 

包含满足 v ( a } )>4 的任何元素。 

设“一个反例链”是具有两个小步的一个加法链，使得 rU r )>4, 但〜 是非特殊 

的。如果反例链存在，则设1 = … 是有最短长度的一个反例链。 

于是步 r 不是一个小步，因为除了特殊的 n 以外，定理 B 的证明中提出的六个类型 
中没有一个可以后跟具有的小步。此外，步骤 r 不是加倍，否则 a 0 , …， 

〜 <将是一个更短的反例链；而且步骤 r 是一个星步，否则 a 0 ，."， a r — 2 ， a r 将是一 
个更短的反例链。于是 

a r = + a r~k •> k 而且 A ( a r ) = A ( a r ... ^ ) + 1 (21) 

设 c 是由算法 4.3.1 A 在二进数系中把 i 加到 〜 ^上去时出现的进位个数， 
利用基本的关系式 

v ( a r ) = v ( a r _ i ) + v ( a } ^ k ) - c (22) 

我们现在可以证明步 r ~ 1不是一个小步 (见习题14)。 

设 m 或 r - l 都不是一^个小步，因此（: >2;而且仅当 
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a 


i >2 


m 



2 


m - l 


时，才有 c 




2 


现在我们假设 r - l 不是 一 个星步。则 r - 2 是一个小步， a 0 , 


y ^ y 一 3 ^ ^ T - 1 


个仅有一个小步 的链； 因此 


a r — 


且 


a 


— ，）<4 


(a 厂） 




4 ，〆 


a 






2 ,k = 2 ，c 




2， v 


a 


- 2 ) 




4时才成立 0 从 


CL r ^ | 


2 m +2 


m 


一 1 


;因此 a 0 , a { , 


••• ，心 — 3 


2 


m 


1 +2 


771—2 


是仅有 


现在关系 （22) 仅当 
:二2我们得到结论， 
个小步的加法链，而 


且它必是类型1的，所以〜属于情况3。 于是， r _ l 是一个星步。 


现在假设对于某个 


2’a … 


k o 


如果 v 


a ，—— 


r 


则由 （22 )，c 




2 y k 


2, 


而且我们看到，&必属于情况3。另一方面，如果 
且通过考虑每种情况容易看到， 1 也属于四种情况之一 


4,则 




(例如，当 a 


特殊的，而 

r - 1 90 ， (I r _ k 


= 45时；或当 a r _! = 

何〖 y CL r - \ Cl r ^ ^ O 


— k 


时出现情况 


) 因此，我们可以得出结论：对任 


我们已经证明，对某个 q >2 y 


一 1 


义 ——2 



a 


如果 


且 


a 1 ， ■•■ ， U/* — r — 2 

定々 >2。 

现在让我们假设 AU 



a 


= a r 是 


个反例序列，其中 A >2;因此我们可以假 


= -1; 如同习题14中所说明的，通过类似的论证， 


A ( 

此 


a 


- j < 


m 


的情况可以排除 


如果 




则 


和 


3两者都是小步；因 


^ y - 4 


2 


m 


- 1 


，而且 （22) 是不可能的。因此々=3;步 r -2 是小步 


a 疒一 3 


2， c 


>2 m 


m 


以及 


CL r — \ 


4。当 


a 


加到 


a r — 


上时，至少应有 


两个 进位； 因此 


^ r — 2 


4 ,且~_ 2 (是特殊的而且大于等于者…对某个^有形 


式2 


DL - \ 


+ 2 


m 


2 + 2川 + 2 d 


现在 


或者是 


m 


+ 2 rn 


+ 2 d 



或者是 


m 



2 


m - \ 


+ 2^ 


十 2" 


，而且在两种情况下 



-3 


都必定是2 


m 


一 1 



2 


m - 2 


，所以~属于情 


况3 


E . G . Thurber [ Pacific /. Math . 49 (1973) ,229~ 242] 已经推广定理 C ， 以证明当 


v ( n ) >80 \f l(n )^A ( n ) 十4。 


般来说，猜测/ ( 72 ) ^ A ( n ) + lg 〆 n ) 似乎是合理 


的，因为 A . Schonhage 已经非常接近于证明了这 




事实（见习题28)。 




渐近值 


定理 C 表明，对于很大的 n ， 当 


时，要得到 / U ) 的精确值 


大概是十分困 难的； 然而，我们可以确定当 n 


时的极限的渐近特性。 


定理 D 


( A . Brauer , Bull . Amer . Math . Soc . 45 (1939) ， 736 〜 739) 


lim l ^ ( n)l X ( n ) 




lim l ( n)l X ( n ) 




(23) 


71 


n 


证明 


对于 2* 进方法的加法链 (4) ，如果删去链中出现两次的任何元素的第 


次出现，它就成为一个星链；因为如果 A 是未在第一行出现但在第二行出现的2心， 


44,…诸元素当中的头一个元素，则我们有〜 <2( m -1); 因此，对于头 


行中的某 


个 


CI ； ^ Clj 


= ( m — 1 ) 



a 


总计链的长度，对于所有々>1，我们有 
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A < Z (;0 < 厂（”）< (1 + lM ) lg n + 2 k (24) 

如果我们选择，比方，々 =L jig AU )」， 则定理得证 。 I 

如果我们对于很大的 77, 在 （24) 中命 A = AA ( 77 ) -2 AAAU ), 其中 AAU ) 表示 
A ( A ( n ))， 则我们得到更强的渐近上限 

(7? XA ( t ?) + A ( r?)/AA ( 72 ) + O ( A ( rz ) AAA { n ) jXX { n ) 1 ) (25) 

第二项 A (77)/ AAU ) 实质上是从 （24) 能得到的最佳项。对于下限的更深人的分析表 
明 AU )/ AA (〃） 这个项实际上在 （25) 中是必不可少的。为了看出为什么是这样，让 
我们考虑以下事实。 

定理 E(Paul Erdos,Acta Arithmetica (1960)，77 〜 81 ) 设 t 是一个正实数，则对 
于某个小于2的 a 和所有适当大的 m ， 使得 

X ( n ) = ?n y r ^ m + (1 — t ) mj Xirn ) (26) 

的加法链 （ W 的数目小于，。 (换言之，当 W 很大时短到使 (26) 成立的加法链的数 
目大大小于使得 AU )= w 的〃值的个数。） 

证明我们要估计可能的加法链数，为此，我们的第一个目标是对定理 A 进行 
改进，以便能更加满意地处理非加倍。 

引理 P 设 S <^-1 是一个固定的正实数。如果加法链的步 t 不是一个加倍， 
且对于某个 J ,0^; < i y a l < a J (l + 8) l ~ J ，则称步 i 为 一 个“微步”。如果加法链包含 

s 个小步和 t 个微步，贝 1 J 

t < W (1 - Q ), 其中 （1 十幻 2 = 2$ (27) 

证明对于每个微步及某个我们有 q 〈 a ) (1^ 8)' ! rh 0 

k J k 

设 lyy -' At 是区间 G l ， 6 ] ，…，（人， G ] ，其中记号 ( J ，〗]代表使得 j < k ^ i 的所有整 
数々的集合。有可能（见习题 17) 找出非重叠的区间 J ' ，…， J h = ( j \ ， G ] ，…，， 
2 h ] ，使得 

A U … U 厂=人 U … U 厶 

a t , < 吖 （1 + 对于 (28) 

k J k 

现在对于区间 h ，…山 之外的所有步 ？ ， 我们有因此如果令 

q = (〆「 ) + ••• + (/；, - j),) 

我们有 

2 a(,,) < n < 2 r " c/ (l + S) 2q - 2 Hn) + s ~ ( ^ 6)q < 2 AU) …（卜心 | 

转回定理 E 的证明，让我们选择8 = 2^-1，并把每个加法链的「个步骤分成 
三类： 

Z 个微步，^个加倍，^个其它步 ， t ^ u + v = r (29) 

以另一方式计数，我们有 s 个小步，其中 5 +m = r 0 由假设，定理 A ， 以及引理 P ， 我 
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们得到关系式 

5 ^ (1 - mj X { m ) , t + t ； ^3.2715, t ^. 5 /(1 ^ (-12) (30) 

若给定满足这些条件的则有 



种方式来分派这些步到特定的类中。若给定这些步的这样一个分布，我们来考虑如 
何能选择非 微步： 如果步 z 是 (29) 中“其它”步之一，则七>(1+ 8)+.^ ，所以 a , = 


〜+ a 々，其中 8 a ; — — 1。 而且〜1 + 5) 7 — J ._ 】/( 1 十 W — ; ，所 

以 + 这至多给出对于 7 的/?种选择，其中/?是仅依赖于 s 的一个常 

数。对々也至多有/5种选择，所以对每个非微步指定 ； 和々的方式数至多是 

/ 5 2 " ( 32 ) 

最后，一旦对于每个非微步已经选择了和1”，则对微步选择 7 和》 的方式 

将少于 

( r 2 \ 

( 33 ) 

/ 


我们以少于 （33) 的方式，在 0<： k h < j h < r 的范围内选择 i 个不同的下标对 Ghh ) ， 
…，（1，&)。然后对于每个微步 z , 依次地使用一对下标（ ;/2 ，心），使得 


a ) J h < i ； 

b ) 在尚未对较小的诸微步 2 :使用过的下标对当中使…+ a k 尽量小。 

J h h 

c ) a , = a + a k 满足微步的定义。 

J h h 

如果这样的（ ;/7 ，心）对不存在，则我们就得不到加 法链； 另一方面，在指定位置具有 

微步的任何加法链，都必须以这些方式之一来进行选择，所以 （33) 是可能性的数目 
的上限。 

于是，满足 (26) 的可能的加法链的总数是以 （31) 乘 （32) 乘（33)，并对于所有相 
关的 s ， t ， u 和 z ； 求和为上限。现在借助于这些函数的一个颇为标准的估计，即可完 
成定理 E 的证明（习题18)。 I 


推论几 乎对于所有的 nj(n )的值近似 于 A ( n ) + A U )/AA ( n ) 。更精确地 

说，有一函数 / G ?) ， 使得当 00 时 f ( n )—0, 而且 

Pr ( \ 1 ( 77 ) - A ( ?7 ) - X (? i ) IXX (? i )\^ f ( n ) X ( n ) IXX ( n )) = 0 (34) 

(关于这个概率 “ Pr ” 的定义见 3.5 节。) 

证明上限 （25) 表明，无绝对值符号时 （34) 成立。下限由定理 E 得来，如果我 
们让 / U ) 足够缓慢地减少成0,使得当 f ( n )< ( 时，值 N 是如此地大，以致至多有 

dV 个值 使得 十 （1 _ f)A (”） / AA ( n ) 成立。 ■ 

* 星链 乐观的人们感到假定 Un ) ( n ) 是有道 理的； 给定具有极小长度 

/ U ) 的一个加法链，似乎难以相信我们会找不到满足（外观上适度的）星条件的同 
样长度的一个加法链。但在 1958 年 Walter Hansen 却证明了一个引人注目的定理， 
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即对于某些很大的^值， / U ) 确定地小于厂(72)，他还证明了好几个有关的定理， 
我们现在就来研究这几个定理。 

Hansen 的定理从研究一个星链的详细结构开始。设 n = 2% + 2〜 … + 2、其 
中并设1 = &<〜<〜<〜= 77是 m 的一个星链。如果在这个 

链中有^个加倍，我们定义辅助序列 

0 = cIq ^ ^2 ^ **■ d r = d (35) 

其中4是在步1，2,…， 2 当中加倍的数目。我们也定义一个“多重集合”序列士， 

A ，…， 它记住这个链中出现的2的乘方。（一个多重集合是一个数学实体，它类 

似于一个集合，但可以包含重复的 元素； 一个对象可以若干次地作为一个多重集合 
的元素，而且它出现的重复次数是有意义的。关于多重集合的一些熟知的例子，见 
习题19。）多重集合 S , 由下列规则 定义： 

a ) S 0 = |0| ; 

b ) 如果 a ,. + 】 = 2 a , .，贝 I 」5 / + 1 = S , + 1 = j .r + 1 I x G S ,); 

c ) 如果 a , + j = a ,. + % ， 々 < z ， 则 s j+ ) = s, y 心 。 

(符号 w 意味着把多重集合结合在一起，增加多重性。）从这个定义，得出 

a , = (36) 

xG S. 

这里求和当中的项不必是不同的。特别是 ； 

n 二 2 e 。 + 2' + …+ 2' = 2 2 " (37) 

xG. S 

r 

后一求和中的元素个数至多是2/，其中/= r - d 是非加倍的个数。 

由于 （37) 中77有两个不同的二进表示，我们可以把多重集合 S , 划分成多重集 

合 M Q ， Mt ， …， M ,， 使得 

2^ = Xl2 x , 0 < ； < z (38) 

, r 6 M - 

这可以通过把 S ,. 的元素重新排列成¥递降的顺序，并取 M l =\ x ^ x 2 . 
…， jtJ 来完成，其中 2' 十…+2 〜 =2^。这必然是可能的，因为~是诸 e 当中最小 
的。类似地， = Ua + 1 ， xp 2 ，…， a / 丨，等等，这一过程在二进记法下极易显现。 
下面是一个例子。 

设 A ^ ; 包含％个元素（考虑多重性在内），则- 因为&至多有2 7 个 

元素，而且它已经划分成 f + 1 个非空的多重集合。由等式（38)，我们可以看到 

e ) ^ x > e } - rrij , 对所有 x 6 M ； (39) 

通过构造多重集合 M /; (它记录了 iV ^ 原型的历史），我们完成了对星链结构的 
考察。把多重集合5,分划成<十1个多重集合如下： 

a ) M r) = M 3 ; 

b ) 如果 a } + ! = 2 〜 ，则 M /j； = M (，+ I ) j ，- - 1 = \ x - 1\ jo ^ Ma + { )j \ ； 
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c ) 如果 a ,” 二 a ,. +々，々< z •，贝 U (因为 S 2 + 1 = $ b S k ) 令％ = M ( 2 . 十 ⑴减心， BP 

从 M( z + 1) j 删去乂 的元素。 如果& 的某个元素出现于两个或多个不同的多重集合 

M (: + ⑴中，则我们就从具有最大的 ； 值的集合中删 去它； 当纟固定时，这个规则对每 
个 j 惟一地确定 A ^。 

从这个定义得出，对所有 xe M 0 , 

ej + ~ d ^ x ej + d ； - d - mj (40) 

作为这一详细构造的例子，我们考虑星链1，2,3,5，10,20,23，对于它们有/ = 
3 ,r = 6,^ = 3,/=3 0 我们得到多重集合的下列 阵列： 


(^0 /l ，…， A ) : 

( Oq i 0\ j …，… 

(A/o3 ， /V/l 3 ，…， MbS )■ 

( Ml 02 "> 12 5 ♦ ■ * ^ A ^62 )* 

(A/oi ， A/ii ， … ， A^6i ) : 
( A/oo i A^o ) • 



于是 M 40 = U ，2|， 等等。从这个构造，我们可看出木是 S z 的最大 元素； 因此 

dj 6 M /0 (41) 

这个结构的最重要的部分来自等式 （40); 它的直接结论之一是 

引理 K 如果 M ， M UV 都含有一个公共的整数 jc ，则 

-爪 V < (ej - e v ) - ( d u - d } ) < \ (42) 


尽管引理 K 可能看起来不是极端强有力的，但它指出，（当和^^都相当小 
以及当 M y . 和包含一个公共的元素时）步 w 与步 z 之间加倍的数目近似地等于 
指数〜与~之差。这使加法链具有某种程度的规 则性； 而且它提示，假定诸指数~ 
离得足够远，我们有可能证明一个类似于上面定理 B 的结果，即 r ( n ) = e 0 + t 。 下 
面的定理说明了事实上这一点是如何实现的。 

定理 H(W. Hansen y Crelle 202 (1959) ，129 — 136) 设 《 二 2 e o + 2 勹 + … + 2〜， 

> e i > … > G X ) 。 如果 

eQ > 2 e \ + 2.271(^ — 1 ) 且对于 t ， e^i ^ e i + 2 m (43) 

其中 m = 2 L3 271( ，_ ⑴- t ， 则 r ( n ) 二 e 0 + t 。 

证明我们可以假定 i >2, 因为当时，如果没有对诸 e 的限制，这个定理 
的结果是真的。假设我们有”的一个星链1 =以<〜<^"<~= 72,且 r <^ 0 + t - 
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1 。设整数 d ， f ， df ， d r 和多重集合及 S , 反映了这个链的结构，如先前定义 

的那样。由定理 A 的推论，我们知道 /< L 3.271 (z -1)」；因此 m 的值是关于每个 
多重集合从 ； 中元素 个数％ 的真正上限。 

在求和 

〜二 （ 2>.)十 （e 2十…十 （m 

«r€ M /f) M .j 

中，如果我们把这个和式想像成是在二进制系统中进行的，则从对应于的项到 
对应于的项没有进位传播，因为诸 e 相距很远（参考（40))。特别是，对于 j 
关0的所有项之和将不会进位而影响 j =0 的那些项，所以我们必定有 

- a , > 2 2" >2 a( ^ } , 0 < z < r (44) 

x€M. q 

为了证明定理 H ， 我们将乐于证明，在某种意义下， n 的/ 个额外的乘方，必须 

“逐个置入”，所以我们要找出一个方法来搞清楚这些项的每一个实际上是在哪一步 

进入加法链的。 

■ 

设 J 是1 和〖之间的一个数。由于为空而 M „ = jvr ; 非空，我们可以求使得 
为非空的头一步2。 

从定义的方式，我们知道步 Z 是 一 个非加倍：对某个 u<i ~ l . a ,- ai- x + 
〜。 我们还知道的所有元素都是5^的元素。我们将证明同〜相比，心必定是 
比较小的。 

设 A 是的一个元素，则因为 Xj G S u ，故有某个^，使得& G M „ v 。 因此得出 

d t - d u y m (45) 

即，至少有 w 十1个加倍出现于步 w 与步 i 之间。因为如果 d t - d a ^ m ，则引理 K 

告诉我们 ~ l <2 m ; 因此 V 二 & 但这是不可能的，因为由我们对 于步？ 的选 

择，为空。 

S , 的所有元素都小于等于 q + 3。因为如果:和 + 

1则由 （40 )，:rG Mw 且： reM 2 (); 所以引理 K 意味着 U , ~ d u \< 州，同 （45) 矛盾。 
事实上，这个论证证明了， M /() 同没有公共元素，所以 M (? _ 1 )0 = M /0 o 从 （44) 我 
们有 a ； - l >2 A ('.) ，而且因此步 z ‘是一 ‘个小步。 

我们现在可以推导出在这整个证明中什么大概是关键的事 实：乂 的所有元素 
都在 M uQ 中。 因为如果不然，设 jt 是乂的一个元素且 :r $ iVT w () 。 由于 x >0，（40) 意 

味着尤，因此 


e Q 二 f + d - s 

由假设(43)，这意味着 d u > 
d l ( ^ e { + d { - ，矛盾。 


^2.2715 + d ^ 2.271(^ ~ Y ) + e [ + d u 

e , 0 但由 （41)，4 G ，而且它不可能在中，因此 


回到 M /：; 中的元素七，我们有巧而且我们已经证明 。二 0 。因此再次通 
过方程(40)， 
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eQ + d u - d ^ jCj > e 0 d u - d - m Q (46) 

对于所有 j=l，2, …， 〖，我们已经确定满足 （46) 的一个数&，以及一个小步；， 

在这步里项乃可以说已经进人加法链中。如果则出现这种情况的步 z 不可 
能对于和 j' 两者都相同；因为 （ 46 ) 将告诉我们I - X - I < m ，而 M t；; 和 My 的元素 

之间的差距必然大于 m ，因为~和 y 相距很远。我们被迫作出结论，这个链至少包 

含 t 个小步，但这是一个矛盾。 ■ 


定理 F ( W . Hansen ) 

/(2 a + xy)^A + v ( x ) + _ 1) 如果 A ( jc ) + A ( X A (47) 

证明把二进方法和因子方法结合起来，就可以构造一个加法链（一般地它不 

是星链）。设： r=2 1 + … + 2^ ， y = 2、+ … + 2八，其中工1〉 …… > y v 
>0。 

这个链的最初一些步形成2的逐次乘方，直至达到 为止； 在这些步之间， 
另外的一些值2%- 1 + 2 〜 ，2'_ 2 + 2Y 1 + 2' …以及： r 被插入在适当位置上。在已 

经形成的直到 2 A 〃 + ： t (2 7 P' + … +2' Vl 〃) 的一条链之后，继续加： r 并把得到的 
和加倍 jv, - : y,_ + i 次；这就得出 

2 A — 〜丨 + x(2 y ry；^ + ... + 2 y ry l+ i) 

如果对于 t = l , 2 r -, v 已经完成了这个构造，同时为方便起见假定 a + 1 = 0, 则如 
所希望的那样，我们有 2 A + a 的一个加法链。 ■ 


定理 f 使我们能够求出使 / u)<r U ) 的诸值，因为定理 H 给出了在某些情 


况下广 U ) 的一个明显的值。例如，设 


X 


2 


1016 


+ 1 ,^ = 2 



n 


_ o6103 


2 





2 


6103 



2 


3048 



2 


2032 



2032 


21016 


1，并设 



按照定理 F ， 我们有 


)^6106。但对于 m 




定理 H 也适用，而这证明 


厂（”）=6107。 

■ 

大量的计算机计算已经证明，12509是使得 / U )</ Mn ) 的最小的值。对 
于这个 n 值，没有像序列 1，2,4,8,16,17,32,64,128,256,512,1024,1041，2082, 


4164,8328,8345，12509这样短的星链。对于 ^U )=5 和 L ( n)^r U ) 最小的 n 
是 16537 = 2 14 + 9*17(见习题 15)。 

Jan van Leeuwen 推广了定理 H 来证明，如果 eo > … > 匕相距足够远，贝 !] 对于所 


有固定的 k >\. 


r (k2 e o) + t ^ r (kn) < r ( 々 2 ” + ^ ^ 

[Crelle 295 (1977) ， 202 〜 207。 ] 

某些猜测 尽管推测 / u) = r(〃） 看起来是合乎道理的，但我们现在看到这 
是不成立的。另一^个似乎正确的拽测[首先由 A. Goulard 提出并由 E. de Jonquieres 
; feL f I ntermed. des Math. 2 (1895) ， 125 〜 126 中声称“证明”]是 l(2n) — l(n) + 1; 

一 个加倍步是如此有效，因而似乎不可能有比加一个加倍步到〃的最短链还要短的 
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任何2” 的链。但是计算机的计算表明，这一推测也是不成立的，因为 /(191) 二 / 
(382) = 11。 (382 的长度为11的一个星链不难 找到； 例如1，2,4,5,9，14,23,46, 
92,184,198,382。数191是使得 /( n ) = ll 的极小值，用手工证明/(191)>10似乎 

非常困难。作者用计算机生成的关于这一事实的证明，使用了将在 7.2.2 小 节中概 
述的一个后溯法，详细考察了 948 种情况。）使得 L(2n) = /( n ) 成立的最小 4 个 n 
值是 ” = 191,701,743,1111 ； E.G.Thurber 在 Pacific J.Math. 49 (1973),229-242 

中证明，这些数的第3个是这样的 n 的一个无穷系列的一员， g 卩对于所有々>5,23. 
2 k + 7 的无穷多个数之一。推测/ (2/7 )> ZU ) 似乎是合理的，但甚至这一推测也不 
成立 。 Kevin R . Hebb 已经证明，对于所有固定的不是2的幂的整数 m ， 
/(??) — / ( ） 可以变成任意大 [Norices Amer. Math. Soc. 21 (1974 ) ， A 〜 294 ] 。 

/(_)</ U ) 的最小的情况是 Z((2 13 + 1)/3) = 15o 

设 c ( r ) 是使得 Z ( n ) = r 的”的最小值。对于这些 72 的序列计算/( 72 )似乎是 
最难的。我们有下列 的表： 



1 

2 

3 

4 





11 

19 

29 

47 

71 



10 127 

11 191 

12 379 

13 607 

14 1087 

15 1903 

16 3583 

17 6271 

18 11231 


r 

19 

20 
21 
22 

23 

24 

25 

26 
27 


18287 

34303 

65131 

110591 

196591 

357887 

685951 

1176431 

2211837 


对于的值近似地等于 c ( r - l ) + dr -2), 而且这个事实导致若干人推 
测 c ( r ) 好像函数 f 一样 增长； 但定理 D 的结果（对于 w r ( r )) 意味着当 r-oo 
时， r / lg c ( r )- l Q 这里列出的对于大于18的 r 这些值，除了 c (24) 首先是由 

Daniel Bieichenbacher 计算的以外，都是由 Achim Flammenkamp 计算的。 
Flammenkamp 注意到对于10< r <27 ， c ( r ) 可以由公式2 r exp (- dr I lg r ) 很好地近 
似，其中 3 接近 in 2;这同上限 （25) 非常一致。鉴于因子方法，很多人一度猜测， 
c ( r ) 将总是一个 素数； 但是 c (15)， c (18) 和 r (21) 都可为11所整除。或许没有一个 
关于加法链的猜测是保险的！ 

列出的值表明，这个函数令人吃惊地 光滑； 例如，对于在1125<?7 <1148 
的范围内的所有 n ，/(〃）= 13。 计算机计算表明，使用公式 

Un ) = min ( / ( n - 1) + 1，/„) 一 〜 (48) 

可以对所有 2< tz <1000 编制/( ?2 )表，其中 如果” 是素数，则/„ =⑺，否则如果户 
是整除”的最小素数，则 Z P ) + / ( ” /p ) ;而且若？？在表1中则心=1，否则 
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o„ = 0 。 

设 d ( r ) 是方程 L{n) = r 的解 n 的个数，根据 Flammenkamp ，下表列出了这-- 

函数的最初一 些值： 


r 

d(r) 

r 

d(r) 

r 

d(r) 

r 

d(r) 

r 

d(r) 

1 

1 

6 

15 

11 

246 

16 

4490 

21 

90371 

2 

2 

7 

26 

12 

432 

17 

8170 

22 

165432 

3 

3 

8 

44 

13 

772 

18 

14866 

23 

303475 

4 

5 

9 

78 

14 

1382 

19 

27128 

24 

558275 

5 

9 

10 

136 

15 

2481 

20 

49544 

25 

1028508 


d ( r ) 确实必须是 r 的一个递增函数，但没有明显的方法证明这一似乎简单的断言， 
更不必说对于很大的 r 确定的渐近增长了。 

关于加法链，仍然未解决的最毛名的问题是 Scholz ' Brouer 推测，它指岀 

L{2 n — 1) ^ n — 1 + I (n) (49) 

事实上，计算机的计算表明，对于 l < n <24，（49) 中的等式 成立； E.G.Thurber 用手 
mDiscrete Math . 16 (1976) ，279〜 289) 证明，对于^ = 32等式也成立。关于加法链 

的许多研究试图证明 （ 49 )。 数 2" - 1的二进表示中有许多的1，其加法链具有特别 
的重要性，因为这是对于二进方法最糟的情况。 Arnold Scholz 于1937年起名“加法 

链 （用 德文）并且把 （ 49 ) 作为 一 个问题提出来 [Jahresbericht der deutschen 
Mathematiker~ V ereinigung , Abtei 1 ung II， 47 (1937 ) ， 41—42 ]; Alfred Brauer 于 1939 
年证明 


23 

163 

43 

165 

59 

179 

77 

203 

83 I 

211 

107 

213 

149 

227 


229 

233 

281 

283 

293 

311 

317 



l 

表 l 

— 1)^77 — 1 + 

特殊加法链的 

1 ¥J {n 

72 值 

) 




(50) 

319 

371 

413 

453 

553 

599 

645 

707 

741 

813 

849 

903 

323 

373 

419 

455 

i 557 

611 

659 

709 

749 

825 

863 

905 

347 

377 

421 

457 

561 

619 

667 

711 

759 

835 

869 

923 

349 

381 

423 

479 

569 

623 

669 

713 

779 

837 

887 

941 

355 

382 

429 

503 

571 

631 

677 

715 

787 

839 

893 

947 

359 

395 

437 

509 

573 

637 

683 

717 

803 

841 

899 

955 

367 

403 

451 

551 

581 

643 

691 

739 

809 

845 

901 

983 


Hansen 定理证明， /( n ) 可以小于 / * U )，所以为了证明或否定 （49) 肯定需要更 
多的工作。作为这个努力的一步， Hansen 定义了 链（处于/链和链“之间”）的 
概念。在一个链中，某些兀素是划底线的；条件是 …+以，其中七是小于 <2,. 
的最大划底线元素。 


作为一条，链的例子（肯定不是极小的 P 链），考虑 


1’2,4,5,8 ， 10’12，18 (51) 

1 • | — ■ 

谷易验证每个兀素和刖边划底线的兀素之间的差就在链中。我们命表不72 
的 P 链的极小长度。显然， U )。 
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定理 F 中构造的链是一个 / G 链（见习题 22); 因此对于某个 n ， 我们有 l °( n )< 
厂（^)。不知道是否在所有情况下都有 / ( n ) = PU ); 如果这个等式为真，则 Scholz - 
Brauer 推测将被证实，因为有 Hansen 的另一定理： 

定理 G /°(2 r> - l)<n - I + l °( n ) 

证明设1 = ， a i ，…， 〜二？ 2是72的极小长度的 Z Q 链，并设1 = b 。， b I ， b t 

是划有底线元素的子序列（可以假定〃是划底线的）。则我们能得到2” -1 的 
/ G 链 如下： 

a ) 对于包括 Z Q U ) + 1 个数2〜 -1 划底线当且仅当 + 是划底线的。 

b ) 对于 Q < j < t 和对于0< i < b J + l - 包括数 2'(2^ - 1) 都划底线（这总共 

是… - b Q + + b t - ^ 1 = 72 - 1 个数）。 

c ) 把 a ) 和 b ) 中的数排序成为递升序列。 

我们容易验证，这给出一条 P 链： b ) 中的数都等于 a ) 或 b ) 的某个其它元素的两 
倍； 而且这个元素是前边的划底线的元素。 如果七 + ~，其中/:>,是小于~的划 

底线兀素之最大者，则〜= a ; — bj ^bj + i - ~，所以 2 a k ( 2 b j - 1 ) =2' _ 2' 是链中的 

划底线元素，并恰恰在 2^-1 之前。由于 2^-1 = (2^-2^) + (2〜-1)，其中这两 
个值都出现于链中，因而我们得到一条具有 P 性质的加法链 。I 

对应于 （51) 的在证明定理 G 中构造的 链是： 

1, 2, 3, 6,12,15,30,31,60,120,240,255,510,1020, 1023,2040, 

4080 , 4095,8160, 16320 ，32640, 65280 ， 130560 ，261120,262143 

图表示 一个加法链 （1) 以自然的方式对应于一个有向图，其中对于 
顶点被标号为义，而且我们画从~ 到七 和从七到化的有向边作为 （2) 中每步 a ; .= 

aj + a k 的表示。例如，出现于图15中的加法链1，2,3,6，12，15,27,39,78,79对应 
于有向图 



如果对于一个以上的下标对 GA ) 有& = % + %，则在构造有向图时，我们选择一个 
确定的 j 和々。 

一 般来说，除了这样一个有向图的头一个顶点之外，所有顶点都将恰在两个有 
向边的 头部； 然而这并不是这个图的真正重要的性质，因为它掩盖了许多不同的加 
法链实质上可以等价这一事实。如果一个顶点的出口次数是1，则它仅用于后边的 
某 一^ 步中，因此，后边这 一^ 步实质上是三个输入 Uj + a k + 之和，它可以计算为 

+〜 ） + a m ，或者为七+ ( 〜+ ) ，或者为々+ ( 士 + a m ) 0 这三种选择是无所谓 

的，但是加法链的约定迫使我们要对它们进行区别。通过删去其出口次数为1的任 
何顶点，并把来自它的前驱的有向边附加到它的后继，我们就可以避免这样的冗余 
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性。例如，上边的图将变成 


(52) 


我们也可以删去其出口次数为0的任何顶点，当然最后的顶点〜除外，因为这样一 



个顶点对应于加法链中无用的步。 

这样一来，每个加法链都导致一个约简的有向图，它含有一个“源”顶点（标号 
1) 及一个“槽”顶点（标号除源顶点外，每个顶点的入口次数>2,除槽顶点外，每 
个顶点的出口次数>2。反过来，没有有向回路的任何这样的有向图至少对应于一 
个加法链，因为我们可以对顶点实行拓扑排序并且对于每个入口次数^>0的顶点 
写下 d -1 个加法步。通过考察约简的图可以重新构造加法链的长度，无用步除外； 

它是 

(有向边数）-(顶点数 ） + 1 (53) 

因为删去出口次数为1的一个顶点，也就删去了一条有向边。 

我们说两个加法链等价，如果它们有相同的约简有向图。例如，加法链1,2,3, 
6,12,15,24,39,40,79等价于我们作为出发点的链，因为它也导致 （52) 。这一例子 
表明一个非星链可以等价于一个星链。一个加法链等价于一个星链当且仅当它的 

约简有向图只能以一种方式进行拓扑排序。 

这个图表示的一个重要性质已由 N.Pippengei •提出 ：每个 顶点的标号恰好等于 

从源到该顶点的有向通路的个数。于是，寻找 n 的最优加法链的问题等价于对于有 
一 个源顶点和一个槽顶点及从源到槽恰有”个有向通路的所有有向图极小化量 
(53) 的问题。 

由于有向图的对称性，这个特征有一个惊人的推论。如果我们把所有有向边的 
方向颠倒过来，则源和槽的作用互换，而且我们得到对应于同一个〃的加法链集合 
的另一个有向图。这些加法链和我们作为出发点的链有相同的长度（53)。例如，如 
果在 （52) 中把箭头改成从右到左运行，而且按照从右边顶点过来的通路数重新标号 

这些顶点，我们就得到 




对应于这一约简的有向图的星链之一是 

1,2,4,6,12,24,26,52,78,79 

我们可以称这个链为原来加法链的对偶。 

习题39和40讨论了这个图表示及对偶性原理的重要推论。 
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习 



1. [15]当算法 A 终止时， Z 的值是什么？ 

2 . [ 24 ] 给定整数"和: c ， 写出算法 A 的一个 MIX 程序，以计算/ mo d 这里加 是字长。 
假定 MIX 有二进操作 SRB ， JAE ， 等等，它们在 4.5.2 小节已作介绍。写出另一个以串行方式（反复 
地乘以： r ) 计算 〆 1 mod m 的程序，并比较这些程序的运行时间。 

► 3.[22] 怎样通过 （ a ) 二进方法， （ b ) 三进方法， （ c ) 四进方法， （ d ) 因子方法来计算 x 975 ? 
4.[ M 20] 找一个数/ I ，对于它，八进（2 3 进）方法要比二进方法少做10个乘法。 

► 5.[24]图 I 4 示出了“幂树”的头八层。这株树的第々+1层定义如下，假设已经构造了头々 
层： 从左到右依次取第々层的每个节点《，并在它之下（依次）附加节点 


其中1，公丨，<22 ,… 

点。 


n + 1 9 n 



a 2 ,… 


- 


2 


“^是从树的根到〃的 通路； 但抛弃任何一个重复已经在树中出现的数的节 


试设计一个有效的算法，它构造幂树的头 r + 1 层。[提示 ：对于 利用两组变量 
LINKUU ]， LINKR |^] ; 如果 7 是树中的一个数，则这些点分别地指向上和指向右。] 

6 . 1 M 26 ] 如果对习题5中给出的幂树的定义稍作改变，使得 n 下边的节点以递减的顺序 


W 十 a k ^i y n + a 2 , ^ + a! ， n 

而不是以递升的顺序附加上来，则我们得到一株其头5层为 




16 12 10 9 7 

的树。试证明这个树给出了计算/的一个方法，它要求和二进方法恰巧同样多的 乘法； 因此它 
不像幂树那样好，尽管它是用几乎相同的方式构造出来的。 

1 . LM 21 ] 证明有无穷多个77的值， 

a ) 对于它用因子方法比二进方法 更好； 

b ) 对于它用二进方法比因子方法 更好； 

c ) 对于它用幂树方法比二进方法和因子方法都好。 

(这里“更好”的方法是指用较少的乘法来计算/。） 

8.[M2J] 证明幂树（习题 5) 对：^的计算绝不比二迸方法用更多的乘法。 

► 9. [25] 试设计一个乘幂过程，它类似于算法 A ， 但以进制 m -2 s 为基础。你的方法应当执 
竹近似于 lg n + v + m 次乘法，其中是在 7 ?的?? 2 进表示中非零数字的个数。 

10.[J0] 图 15 示出一株树，它指出对所有 ”<100, 以最少的乘法次数来计算： T” 的一个方 
法。这株树怎样能在仅有 100 个存储单元的一台计算机内方便地表示出来？ 

► 11 . [ M26 ] 图 15 的树描述/对于链中所有 z •，有 l { a t ) = i 的加法链^[(，^，…，^。当 n = 43 

和77 =77 时，试求对于”的所有具有这个性质的加法链。试说明图 15 这样的任意树必然包括通 
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路 1,2,4,8,9,17,34,43,77或通路 1,2,4,8,9,17,34,68,77之一。 

12. [ M 10] 对于所有正整数〜是否有可能推广图15中示出的树成为一株对于计算/来说 
提供极少乘法规则的无穷树？ 

13. [ M 21] 对于定理 C 中所列的四种情况的每一种，找出长度为 A +2的一个星链（因此定 
理 C 对于以 厂代替 /也成立）。 

14. [ M 29] 通过揭示 U ) 步 r - 1不是一个小步以及 （ b ) 不能小于 m _ l , 来完成定 

理 C 的证明。 

1 5 . [ M 43 ] 写出一个计算机程序以推广定理 C , 表征所有使得 Z ( t 7) = A ( t 2) + 3 的77和所有 
使得 / 的 n 。 

16. [ HM 15] 证明定理 D 不是仅仅由于二进方法而显然成 立的； 如果 P (72) 表示由二进的 S 
和 X 方法产生的77的加法链长度，则当 rz — ⑺时，户 U )/ A ( n ) 不趋于一个极限。 

17. [ M 25] 说明怎样找出在引理 P 的证明中所要求的区间 J '、 …， J h 。 

18. [ HM 24] 设是一个正常数，证明有一个常数 a <2 使得对所有的大数 m , 

2(=)0广( ( ，. )2 )<，， 

其中求和是对满足 （30) 的所有进行。 

19. [ M 23] 一个“多重集合”类似于一个集合，但同一元素在其中可以重复有限次。如果 A 
和 B 是多重集合，我们定义新的多重集合 A tt ) B , AUB , ADB 如下： 一个在 A 中恰巧出现 a 次 
和在 J 3 中恰巧出现6次的元素，在 A 中恰巧出现 a + 6次，在 AUB 中恰巧出现 m a xU ，6) 
次，在 ADB 中恰巧出现 min ( a ，6) 次。（一个“集合”是含元素不多于一次的多重 集合； 如果 A 和 
B 是集合，则 AUB 和 A 也是，而且本题中给岀的定义同通常集合的并和交的定义一致。） 

a ) —个正 整数〃 的素因子分解是一个其元素为素数的多重集合 IV ，这里 n ；>= ”。每一个正 

/>€： ：\ 

整数都可以惟一地分解成素数这一事实给了我们一个在正整数和素数的有限多重集合之间的一 
—对应 关系； 例如如果 n =2 2 *3、17, 则对应的多重集合是 N = U ,2,3,3,3，17!。 如果 M 和 iV 是 
对应于 w 和 n 的多重集合，贝 U 什么是对应于 gcd ( m f n ) , lcm ( m ， r ?) 和 m / z 的多重集合？ 

b ) 复数上的每一个首一多项式 /( z ) 以自然方式对应于它的“根”的多重集合 F ; 我们有 f ( z ) 
= 11& F U - 〔）。如果 /( z ) 和是对应于复数的有限多重集合 F 和 G 的多项式，则对应于 

F yG ， FUG 和 FPIG 的多项式是什么？ 

c ) 尽你之所能，找出多重集合之间相对于三个运算 W ， U 和 PI 成立的有趣的恒等式。 

20. [ M 20] 在 （ a ) 类型3的 ，（ b ) 类型5的星链的 Hansen 结构分解中出现的序列 S , 和 A ^(0< 

是什么？ （6 种“类型”在定理 B 的证明中定义。） 

► 21. [ M 2 6 ] ( W . Hansen ) 设 g 是任何正整数，试求使得 / ( nX〆 （ n ) - g 的一个?？值。 

22. [ M 20] 证明在定理 F 的证明中构造的加法链是一个 P 链。 

23 . [ M 20 ] 证明 Brauer 不等式 （ 50 ) 。 

► 24. [ M 22] 推广定理 G 的证明，以证明对于任何整数 B > 1, - 1 )/(B - 1))< 

(/? 一1)/ 0 (5) + / 0 (70;并且证明/(2_-1)</(2”'-1) + 772« - 777 .十 / 0 ( rO 。 

25. [20]设 y 是一个小数，0<7<1,在二进数系中表示成 y =(.山…4 ) 2 。试设计一个算 
法，利用乘法和开平方根的运算来计算 P 。 

► 26. [ M 25] 给定很大的整数 n 和 m ，试设计一个有效的算法，它计算模 m 下的第 n 个斐波那 
契数 F „。 

27. [ M 2 i ]( A . Flammenkamp ) 使每个加法链至少包含 6 个小步的最小的 n 是多少？ 

28. [ HM 33 ] ( A . Schonhage ) 本题的目的是给出 I ( n ) ^ X ( n ) + lg v { n ) ~ 
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0 (log logUU ) + l )) 的一个短证明。 

a ) 当 1 二 （ A … :c 0 . ：C _ 1 … ） 2 和 V - ( " \ V0 ■ V - r " ) 2 都是以二进制写出的实数时，如果对所 

有 h + 我们就写 ^'^3^0 给出构造具有下列性质的最小: r 的一个简单 规则： 和 

意味着+ 用 ： r 表不这个数，证明 〆 Jr ▽: vXv (、 f )+<\，）。 

b ) 给定使 r =/ U ) 的任何加法链（11)，设序列 K …， < 如 （35) 中所定义的那样，用下列 

规则定义序列 A 0 , A J> --, A r ： 〜 =1;如果 屮 = 2屮 - i ， 则八， 2 A ,_ 1; 否则如果对于某些0< 
々<_；0，屮=七+〜，则 A ; 二对于 0< z < r ， 有… QA ,， 在此意义下证明， 

这一序列“覆盖”给定的链。 

c ) 设 S 是一个正整数（下面再选择）。如果则称非加倍步 a ,. = ~ + a 为“婴步”， 
否则称它为“闭步’。设 Bo = 1;如果 a ,. 二 2 a ,. _ !，则 B , = 2 B ,. _ t ;如果 ai = aj + 是婴步，则 B ； — 
B ;— :)，其中 pU ) 是对0<£><夂使得 xlr ^ y 的最小数。证 
明对于0<〗<^4 1 .£_8,.且〃（氏)<(1 + &,)2 / 〜，其中6 / 和 c , 分别表示小于等于丨的婴步和闭步 
的个数。[提示 ：证明 B , 中的诸1出现在大小>1+ &■; 的连续块中。] 

d ) 我们现在有 /(/?)- r ~ b r ^ c ,. + ^ v ( 7, X w (氏 X ( 1 + 。说明怎样选择汐以 

便得到本习题开始时指出的不等式。[提 示：见 （16)，并注意对于某个依赖于 S 的 a < l ， 

2 r ar 0 ] 

29. [ M 49] 对所有正整数？7,是否有 v ( nX 2 lin ) - x ( r ,) ? (如果是，我们有下限 L {2 n - 1)> 
n ~ \ +「 lg wl ; 参考 （17) 和（49)。） 

30. [20] 一个加减法链以规则 义二… 代替 （2); 正文中介绍的想像的计算机有一个新的 

操作码 SUB (这在实践中对应于用乘和除法来计算 ： r ”）。 对于某个〃，找出一个加减法链，它少于 
IU ) 步。 

31. [ M 46]( D . H . Lehmer ) 给定一个小的正“权％，试剖析加法链 （ 1 ) 中极小化邛十 （ r _ (?) 的 
问题，这里9是“简单”步的个数，在这些步当中 a , - a ,-! + lo (如果乘以2的乘法比一般 乘法更 

为简单，则这个问题就更接近于计算/的许多实际应用。参见 4.6.2 小节中的应用。） 

32 . [/ VOO ]( A . C . Yao ， F . F . Yao 和 R . L . Graham ) 把“开销”“丹同一个加法链 （ 1 ) 中的每一步 

ai = a } + a k 关联起来。证明自左至右的二进方法对于所有正整数〃产生极小总开销的一个链。 

33. [15] 有多少长度为9的加法链以 （52) 作为它们的约简有向图？ 

34. [ M 23] S e 0 > … > h >0 时，《 =2〜+ …+25的加法链是 1，2，…，2气1，2%一 e i 十 1，…， 
2 D +2 f i _~，2 D + 2 e i -〜 十1，…，； 2 。这对应于本节开始处介绍的 S 和 X 方法，而算法 A 对 

应于把两个序列（1，2,4,…，2 〜） 和（2'-1 + 2〜，2%2 + 2^ +2〜，…， r 7) 排序成递升序列所得到的 
加法链。证明或否定 ：这些 加法链每一个都是另一个的对偶。 

35. [ M 27] 当. 0 >^+ I 时，没有无用步的加法链有多少等价于习题34中所讨论的加法链？ 

► 36. [25 ] (E. G. Straus) 找出至多用 2A (max( /z !， 刀 2 ，…， ”," ）） + 2"’ - m ~ \ 次乘法来计算一般 
单项式、… O 的一个方法。 

37. [ HM 30]( AT . Yao ) 设/ U ,，…，〜, ） 是含有 m 个给定的数 n t … 的最短加法链的 

长度。证明 /( W , 〜 X /1 ( ”,,, ) + mX( n m )1 XX ( 7i w ) + 0(X( n m ) AAA ( n n , )/AA ( n tn ) 2 ) ， 由此推广 

(25)。 

38. [ M 4 7 ] 在习题 37 的记法下，当 m — 00 时，/ ( 1，4,9，…， m 2 ) - m 的渐近值是多少？ 

► 39. [ MZ 5]( J .0[ ivos ，1979) 设/ ([ ，/ z 2 ，…，％ ]) 是在习题36的意义下计算单项式工弘… 

X 所需要的极小乘法次数，其中每个化是正整数。通过证明/ ( [ « ! , 77 2 , ] ) = / ( n 1 , 


• 443 • 




第 4 章算术 


rz 2 ,--, rz , J + w -1 来证明这个问题等价于习题37中的问题。[提示 ：通过 考虑有一个以上源顶 

点的图来推广有向图的构造。] 

► 40. [ M 21 ]( J . Olivos ) 推广因子方法和定理 F ， 证明 

/ ( 7/?! 7?! + …+ m t n t ) ^ /( m ) + l(n { , n t ) + t - 1 

其中 / U , ，…，~)在习题37中定义。 

41 . [ M 40 ] ( P . Downey ， B . Leong , R . Sethi ) 设 G 是具有 rz 个顶点 11 , …， tz 丨和个边的 一 个连 
通图，其中对于 l < j<m 这些边连接士到％。证明对于所有充分大的 A ，/(1,2，一，2 a ”，2' + 
2 a "i + 1，".，2 a % +2 a ' + }) = An + m + 々，其中々是 G 的一个顶点覆盖（即对于或包 
含〜 或包含％的一个集合）中的极小顶点数。 

42. [ m 0] 对于所有正整数 〃，是 否 l (2 r, ~ l)^n ~ 1 + l ( n )? 等式总是成立吗？ l ( n ) = 
/ 0 “）吗？ 

4.6.4 多项式求值 

我们已经知道了计算特殊多项式： r ” 的有效方法，现在让我们考虑对于给定的 
X 值，计算 一 '个72次多项式 

u(x) = u n x n 1 十 … 十 … 工十 Wq ， U n ^ 0 ( 1 ) 

的问题。这个问题在实践中经常出现。 ^ 

在下列讨论中，我们将集中研究把用计算机计算多项式所需要的操作次数极小 
化的问题，并大胆地假定所有的算术运算都是精确的。多项式通常是用浮点算术求 
值的，浮点运算是不精确的，而且对于不同的求值方案一般地将给出不同的答案。 
所达到的精确度的数值分析依赖于所考虑的具体多项式的系数，而这超出了本书的 
范围； 读者应该注意观察以浮点算术进行的任何计算的精确度。从数值的观点看， 
我们将介绍的方法在大多数情况下已被证明是相当令人满意的，但也可以给出许多 
坏的例子。[关于多项式快速计算的稳定性的著作的综述，以及关于对某些高速算 
法来说不能保证某种数值稳定性的说明，见 Webb Miller , SJCOMP 4(1975)，97〜 
107。] 

在一小节，我们将认为变量： r 就是一个数。但是重要的是要牢记，当变量是多 
精度数，多项式或矩阵这样的大对象时，我们将讨论的大多数方法也将正确。在这 
样的情况下，有效的公式导致甚至更大的报偿，特别是当我们能减少乘法的次数时。 

程序员新手通常直接以教科书上给出的形式计算多项式 （1): 首先计算 u 〆 ， 
然后计算 • ixi 1 ， …，〃^，最后把 （1) 的所有项加在一起。但即使使用 4.6.3 小 

节的有效办法来计算这种方法下的 x 的乘方，所得到的计算不用说也是缓慢的，除 
非几乎所有的系数^都为零。如果这些系数都非零，另一种显然的办法是从右到 

左地计算 （ 1 ) ，对于 , n 计算/ 和十…+ 的值。这样 一 个过程含2 n 

- 1个乘法和〃个加法，它还需要一些指令来存储和从内存中检索中间结果。 

霍纳规则通常教给程序员新手的最初的技术之一是重新安排这个计算的一 
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个巧妙方法，即用下边的方法计算 ^(. r )： 

"( x ) = ( …““”…2 + …）了 + “0 ( 2 ) 

从 U ，, 开始乘以 JC ， 加心乘以 J ：， …，乘以1，加〃0。这个计算形式通常称做“霍 

纳规 则”； 我们已经看到它用于 4.4 节的进制转换中。整个过程要求 n 个乘法和^ 
个加法，对于每个为零的系数减少一个加法。而且，没有必要存储中间结果，因为在 
计算期间岀现的每个结果一旦被算出就立即投人使用。 

W . G . HorneK 霍纳）在19世纪初为计算多项式的根而给出了这一规则 [ Phi / o - 

sophical Transactions f Royal Society of London 109(1819) ， 308 〜 335] ， 这 一 方法如此 
命名[见 J . L . Coolidge ， Maf / iemat/cs of Great Amateurs ( Oxford ， 1949 )， 第 15 章]的 
原因是霍纳的名字已与 （2) 联系在 一 起；但是实际上 Isaac Newton (牛顿）早在150年 
前就利用了同 一 思想。例如，在最初写于1669年，题为 De Analysi per /Equationes 
Infinitas 的一篇有名的著作中，牛顿把多项式: y 4 - 4 jy 3 十 5 jy 2 - 12 ：y + 17写为 

y ~ ^ ^ y ： + 5 x I — 12 x ^ y : + 17 

同时说明后来被称为牛顿求根方法的思想。这显然说明 （2) 的思想，因为他通常使 
用水平线和冒号代替括号来表示分组。在未发表的笔记中牛顿已经使用这个思想 

许多年了。[见 "The Mathematical Papers of Isaac Newton , D . T . Whiteside 编， 1 

(1967),490,531； 2 (1968) ，222。 ] 独立地 ，一 个等价于霍纳方法的方法事实上在 13 

世纪时在中国就被秦九韶使用了 [见 Y . Mikami,Tiie Development of Mathematics in 
China and Japan (1913) ,73 〜 77] 。 

已经提出了对霍纳规则的好几个推广。我们首先考虑2是一个复数而系数^ 

是实数时计算 w ( z ) 的方法。特别是，当 z = e' 6 — cos Q + i sin 6 时，多项式 u( z) 实质 
上是两个傅里叶级数 

( ^0 + u \ cos d + + u n cos nd) + i ( u x sin ^ + u n sin rid) 

显然，复数加法和乘法可以归结为对实数的一系列 运算： 

实+复要求1个加法 
复+复要求2个加法 
实 x 复要求2个乘法 
复 x 复要求4个乘法，2个加法 

或3个乘法，5个加法 

(见习题41。这里减法被认为和加法等价。）因此当 z = x + w 为复数时，霍纳规则 
(2) 使用 4 n - 2个乘法和 3 n -2 个加法，或者 3 n -1 个乘 法和“ - 5个加法来计算 
u (^) 0 实际上这些加法中的 -4 个可以节省，因为我们每次乘的是同一个数二。 
计算+ 的另一个过程是设 

= 、， b x = h ， r = x + x y s = x 2 ^ y 2 ( 3 ) 

cij ~ 1 十 raj _ I, bj - u )} -j - sa 厂卜 1 <C j ^ n 
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然后用归纳法容易证明 t / U ) = M 〃 + 6。 这个方案 [Brr 5(1965),142; 也见 G . 


Goertzel , AMM 65 (1958) 




35] 只要求 



个乘法和 



个加法，所以当 


时它是对于霍纳规则的改进。在傅里叶级数的情况下，当 z = 时，我们有 X 
，所以乘法的次数降到72 + 1。这个事实的寓意在于一名好的程序员不应无选择 
地使用高级程序设计语言内部的“复数算术”特性。 


考虑用 


X 


x 0 除多项式 w U ) 的过程，并使用算法 4. 6. 1 D 来得到 


U { X 


(x - xq ) ^ q ( x ) + r ( x ); 这里 deg ( r ) < 1，所以 r ( x ) 是 




个与 


X 


无关的常 


数，而且 u ( x o ) = O - q ( x 0 ) + r = ro 对这个加法过程的考察揭示，这个计算实质上 
和计算 i / Uo ) 的霍纳规则相同。类似地，如果我们以多项式 U _ z G )(z - 。）= 

+ d + W 除 W ( z )， 则得到的计算结果等价于 （3); 我们得到 wU ) 二 


( 2 ： - 2 ： 0 )(之 一 Zo ) q ( z ) + a n z + \ ， 因此 w ( 之 0 ) = a n z 0 + b n 0 


一般地说，如果以/( X )除以1)，以得到 u ( x )= f ( x ) q ( x ) + r ( x )， 则只要 

/( X (0=0, 就有 1 /(^ 0 ) = r (: c 。） ；这个发现导致了霍纳规则的进一步推广。例如，我 


们可以设 fix ) 




工一 


2 这就产生了“第 


工0; 


阶”霍纳规则 


u { x ) =(… ( “2 U /2」 了 + u 2 ln ! 2 \- 2 ) x 



馨 裊 


X 


2 



UQ + 


((•■•( ^ 2 \ h/21-I^ 2 + W 2 「 ”/ 2 V3)I 


2 



參 ip 


) 


X 


2 



U 


) 


X 


⑷ 


第二阶规则使用72 + 1个乘法和77个加法（见习题 5); 所以从这个观点来看它不是 
对霍纳规则的改进。但至少在两种情况下 （4) 是有用 的：如 果我们要计算 Wi ) 和 
w ( - I ) 两者，则这个方法只须多做一次加法运算就产生出 《( -X); 两个值几乎可 
以像一个值一样方便地得到。而且，如果我们有允许并行计算的一台计算机，则 （4) 
的两行即可独立地求值，所以我们节省大约一半的运行时间。 

当计算机允许一次在々个运算器上并行计算时，可以使用一个“第々阶”霍纳规 
则（由/(工）=/-：4以类似方式得到）。进行并行计算的另一项有吸引力的方法 


已由 G . Estrin 提出 [ PVoc . Western Joint Conputing Conf . 17 


(1960),33 〜 40]; 当 72 = 


7 时， Estrin 的方法是： 

处理器1 处理器2 处理器3 处理器4 处理器5 

a { - u 7 x + u 6 6i=w 5 x 十 U 4 ci = u^x + u 2 d x = u^x + x 2 


ao 

4mm 




a\X 





x 4 



这里 a 3 = u ( x ) o 然而， w . S . Dorn 的一个有趣的分析 [IBM J . Res . and Devel . 6 

(1962),239 〜 245] 表明，如果每个算术单元都必须访问一个一次只同一个处理器进 
行通信的存储器的话，则这些方法通常并不是对第二阶规则的改进。 


多项式值造表 如果我们希望在一个算术级数的多处地方计算 n 次多项式（即 
如果我们要计算 wU G 〉， i / U G + /0，“（以+ 2/0，一），在开头少数几步之后，这个过 

程可以归结为仅做加法。因为如果我们以任何数列 U G ， 〜，… ，〜） 开始并应用变换 
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— a 0 

我们发现 A 次应用 （5) 产生 


0 I 


， a[ — q 





} 


，0，？ _ 1 







a 


n 


⑸ 


a 


⑴ 


k \ 





+ 



( k \ 
\2 





y 


OK 


^ n 


其中 ft 表示 ~ 的初始值且对于 ； >^2 



0。特别是 


a 


(k) 

o 


k 







/ 


VI 


/?! 



+ 


k 


n 


A 


( 6 ) 


是々的 72 次多项式。如习题7中所示，适当地选择诸/?，我们可以把事情安排成，对 

所有的々，量是所需的值 U ( x ^+ kh ) 0 换句话说， （5) 中 72 个加法的每次执行 

将产生给定多项式的下一个值。 

警告 ：在多 次重复 （5) 之后舍人误差会累积，因而~的一个误差产生了在所计 
算多项式中系数:，…，/的对应误差。因此，在大量迭代之后诸 a 的值应当“刷 

jni ^ 

勒 o 


变量的导数和变化 有时我们希望在给定一个常数 X Q 和 1/ U ) 的系数的情况 
下求 wU + JT 。） 的系数。例如，如果 W (: T) = 3 x 2 + 2 x - lJ 〗 u ( x -2) = 3x 2 -10x 

+ 7。这类似于把基数: r 转换成基数 x + 2 的进制转换问题。由泰勒定理，通过在 x 
= A 对 t〆 1) 求导数，即得所求的系数，这就是 

“(X 十： To ) = u(jCq) + u' ( xq ) X + ( W "( Xo )/2! ) J ： 2 + …+ ( (jcq) I n\) x n 

(7) 


所以问题就等价于求和它的所有导数。 

如果我们写 u{x) = q{x)(x - x 0 ) + 厂，则 u(x + x 0 ) = q (x + 上 0 ):c + 厂；所以 

r 是的常系数，而且问题归结为求 7 (工+工0)的系数，其中是已知的 
n - 1多项次式于是有下列算法： 

H1 •对^ n 置 Vj — Uj 。 

H 2 .对于 A =0，1， …， 72 - 1( 在此顺序下），对于 j = n - l ， …， 々 + 1， A (在此顺序 


下）置 v 广 



^ 0 ^ j + 1 ° 



在 H 2 步的结尾我们有 w (: r +工0) = t % 〆 +…+ ^ i：c +叫。这个过程是霍纳求 

根方法的主要部分，而且当々=0时它恰是计算 W ( x Q ) 的规则（2)。 

霍纳方法要求 （ n 2 + n )/2 次乘法和 U 2 + ")/2 次 加法； 但请注意，如果 x 0 = 1, 

就可以避免所有的乘法。幸运的是，我们通过引人比较少的乘法和除法就可以把一 
般问题归结为 x 0 = l 的情况。 

S 1. 计算并存储值 xg ， …，4。 

S 2 ■ 对于 (X j 置 v 广 w〆 。 。 （现在 r ( jc ) = w ( x G ) 。 ） 

S 3. 执行 H 2 步，但取 j：-q = 1 o (现在 v ( x ) ~ u ( x Q (x + 1)) ~ u ( xqx + x 0 ) 。 ） 

S 4 .对于0 < j < /2置 ％ — q / :?;」。。（现在 r ( x ) = x + a .。） 如所求 。） I 
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这个思想是 M.Shaw 和 J . F . Tmub 给出的 [JACM 21 ( 1974 )，161〜 167] ，和霍纳方 
法有同样多次的加法及同样的数值稳定性，但它仅仅需要 2n - 1 次乘法和 n - 1 次 


除法，因为 v n = 这些乘法中大约有 + n 个又可以避免（见习题 6 )。 

如果我们只要最初一些或最后一些导数， Shaw 和 Traub 已经发现有进一步的 
方法来节省时间。例如，如果只要计算以幻和 / U )， 我们可以用 2 n - 1次加法 

和大约72 +次乘除法做这一工作 如下： 


D 1. 计算和存储值 x 2 , x 3 , x lL ，其中 t = [ \! n \2 ~\o 

D2 .对于 Q«n 置％ x^) ， 其中对于 0<j< n ， /G) = Z — 1 _ ((n - 1 _ 


j ) mod 20 且 /( n 

对于户 n - 1 ，…， 
数时 gG )= 2r ， 否. 


o 


置 


< — 


这里当 72-1 -厂是 的倍 


2r ， 否则 g G ) = 0 且不需要乘以 ： T 


s ( j ) 


D4j j 


n 


， 2 , 1 ，置 


V 


V ： 



V J 


x 


g(j) 


现在 




= U ( 


X 


)且 


V 


/ :r /■⑴ = 


X 


系数的改写 现在转到我们原来的问题，即对于“随机”的 X 值，尽可能快速地 

I 

计算一个给定的多项式 u { x ) o 这个问题的重要性部分地是由于像 sin : c，cos .r , e r 
等等标准函数通常是用子程序计算的，而这些子程序依赖于某些多项式的计算。这 
种多项式求值是如此经常地出现，因而我们希望找出最快的方法来进行这一计算。 

如果我们首先对系数 u ^ u x r -, u n 进行“改写”或“加些条件”，则五次或五次 

以上的任意多项式可以用少于霍纳规则所要求的操作次数来求值。如以下所说明 

的那样，这个改写过程可能包含大量的 工作； 但是它不会白做，因为它只须做一次就 

够了，而多项式的求值要做多次。关于标准函数的“改写后的”多项式的例子，见 V . 
Y . VariyUSSR Computational Math , and Math . Physics 2 (1963) ， 137 〜 146。 

系数的改写有助于多项式计算的最简单的情形是一个四次多项式 

u { x ) = U 4 X 4 + W3X 3 十 U2X 1 + WiX 十 Wo ， W4 ◦ ( 8 ) 

这个等式可以改写成为最先由 T . S . Motzkm 提议的一种形式 

y = (x + a 0 )x + , u ( x ) = ((y + x 十 a 2 )：y + a 3 ) a 4 (9) 

其中 a 0 ^ 1 ^ 2 ^ 3 ， a 4 是适当地“改写”的系数。这一方案中的计算包含三次乘法， 

五次加法，及（在如 MIX 这样的单累加器机器上的） 一 条存中间结果^到临时存储器 
中去的指令。同霍纳规则作比较，我们已经用一个加法及一个可能的存储指令换下 
了一个乘法。如果这个多项式要经常求值，则上述比较小的节省也是值得的。（当 
然，如果乘法的时间同加法时间相等， （9) 就没有什么 改进； 我们能看到一般的四次 
多项式总是至少要求八次算术运算来求它的值。） 

等置 ( 8 ) 与 （9) 的系数，我们得到借助于诸^计算诸~的 公式： 
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a 2 — ^ 2a\ y a^= uqI - + ao) , a A = w 4 (10) 

一 个类似的方案（见于习题 18) 在和 （9) 同样多步内计算一个四次多 项式； 该法在某 
些情况下将给出比 （9) 更大的数值精度，尽管在其它情况下它产生较差的精度。 

在实践中通常出现的多项式的前导系数都比较小，使得在 （10) 中除以导致 

不稳定性。在这种情况下，首先用 U 4 r /4 : r 代替 x 通常是可取的，这样做可把 （8) 归 

结为其前导系数为±1的一个多项式。一个类似的变换可以应用于更高次的多项 
式。这一思想是 C . T . Fike 给岀的 [CACM 10 (1967) ，175〜 178] ，他给出了好些个 
有趣的例子。 

使用规则 u ( x ) = UU ): r 十 w Q ， 其中利用 （9) 中的方法计算 U ( x ) = u 5 x a + 
u A x 3 + u z x 2 + u 2 x + ^，则任何五次多项式都可以用四次乘法，六次加法及 一 次存 
储来求值。或者，如果计算的形式是 

y = {x + a 0 ) 2 , u ( x ) = (((y + a x )y + a 2 )(x + a 3 ) + a 4 ) a s (11) 

则我们可以用四次乘法，五次加法及三次存储来进行计算。为了确定这些 a , 需要 
解一个三次方程（见习题19)。 

在许多计算机上， （11) 所要求的存储操作的次数小于3。例如，我们能够计算 
U + « Q ) 2 而无须存储 ： c + a 。。 事实上，现今大多数计算机有一个以上的算术寄存器 

用于浮点计算，所以我们可以完全避免存储。由于在不同的计算机上算术运算广泛 
多样的特性，因此在本小节后半部我们将仅仅计算算术运算的次数，而不涉及由累 
加器到存储器及由存储器到累加器的操作。计算方案通常可以以简捷的方式加以 
改编，以适应任何具体的计算机，并只需要很少的辅助 操作； 另一方面，必须记住，这 
种额外的开销也可能使得我们节省一两个乘法这一件事变得没有多少意义，特别是 
如果机器代码是由未予以优化的编译程序产生的时。 

使用 


Z 


X 


u(x) 




-a^) x y w 

((zv z a 4 ) zv 



: r + ) 之十 

^ 5)^6 


( 12 ) 


的方案，用四次乘法和七次加法，通常就能计算一个六次多项式 u{x) - U 6 JC 


6 


+ 


■ ■ 1 



“ 0 。[见 D . E . Knnth ， C 4 CM 5 (1962) ，595〜599。]这就节省了霍纳规则所 


要求的六次乘法中的两次。这里我们又要解一个三次方程 ：由于 a 6 = ，我们可以 

假定 W 6 ~ 1 o 在此假定下，令仏= ( W5 - 1 )/ 2 ，/? 2 = w 4 -( 卢 1 + 1 ) ， ft = .“3 - 卢 2 ， 

ft = / 5 i - = w 2 - 令 ft 是三次方程 

2y 3 + (2/? 4 - /?2 + l)_y 2 + (2/? 5 - Ihlh - (h)y + (u [- ftft) = 0 (13) 

的一个实根（这个方程总有一个实根，因为对于很大的正左边的多项式趋于 
+⑺，而对于很大的负^它趋于-^ ;因此它必定在这之间某处取 0值）。现在如果 
定义 

Pi — ^ p4p6 ft ， A = ft ~ ft — Pi 

则我们最后有 
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a 0 = p 2~ 2/?6 ， 

0^2 = P \~ 

^0 ^ 

a 1 二夕6 - 

- a 0 a 2 


^3 ~ Pi ~ ^ { a 2j 

«4 = ^8 — 

々7 1 l ， 

a 5 = " 

_ 夕7卢8 

(14) 


我们可以编造一个例子来说明这一 过程： 假设要计算： r 6 十 13 x 5 + 49 x 4 +• 33 x 3 
61 x 2 ?>1 X + 3， 我们得到 a 6 = 1 ,/?! = 6, /? 2 = 7, /? 3 = - 9, /? 4 = - 1, /? 5 = — 7,因此 

有三次方程 

2 y ^ — Sy 2 + 2 y + 12 = 0 (15) 

这个方程有/?6 = 2作为一个根，我们接着求得 p 7 = - 5 , = - 6 ,ao = 3, a 2 = 3, a , = 

-7， a 3 = 16， a 4 = 6， a 5 = -27。因此得到的方案是 


z = (x + 3 )jo - 7, UO 二 (x + 3)2： + 16, w ( x ) = ( Tt ； + 2 ； + 6) - 27 

正巧，量： T + 3在这里出现两次，所以我们已经找到了一个方法，它使用三次乘法和 
六次加法。 

V . Y . Pan 提出/处理六次方程的另 一 个方法 [Problemy Kibernetiki 5(1961)， 

17〜29]。他的方法要多做一次加法运算，但在预备阶段它只包含有理运算，且不需 
要解三次方程。可以如下 进行： 


Z 


( X ao) J ： -\- 


a 


l ^ 


zv 




u(x) = (((z - x + a 3 ) 


zv 



2 ： 十 ：r + 

a 4 )z + a 5 )a 6 


(16) 


为确定诸 a ，我们再次用 除多项式，使得 W ( JC ) 成为首一的。于是可以验证 




w 5 /3 和 


— (ui - aou 2 + cxo u 3 ~ « o w 4 + 2al)/( _ 2a 0 u 4 + 5^ o ) (17) 

注意， Pan 的方法要求 （17) 中的分母不为0。换句话说，仅当 

21 u 2 ul - 18 u 6 u s u 4 + 5^5 0 (18) 

时 （16) 才可使用。事实上，这个量不能太小，否则^就会变得太大。一旦确定了 
剩下的诸 a 就可以从下列方程 确定： 


= 2a 0 ， 夕 2 二以 4 — «0i^l _ «1 

!h = u 3 - 0^2 —以 101 ， p4= U 2 - tt 0 /?3 _ a\p2 

_ ( a 0 _ 1)" 2 + ( a 0 _ 1)(4 _ 1 )) _ q 

泛 2 二 乡 2 - (d - 1) - - 2ffi , a 4 = /? 4 - (a 2 + aj )(a 3 + a x ) 

^5~ ^Q~ ai/?4 (19) 

我们已经详细地讨论了次数 72=4,5,6 的情况，因为 72 的这些小值在应用中最 

常出现。现在我们考虑72次多项式的一般计算方案，这是包含至多 LW 2」 +2次乘 
法和 n 次加法的一个方法。 


定理 E 具有实系数的每一 n 次多项式， n>3 ，可用下列方案进行计算 


y 


: r 十 c , w 


： y 2 ; 2： 



( u n y + a 0 )y + /?o ， n 为偶数 


u(x) = (… （（ z(w - a,) 



U n y 

A )( 



fio ， 


w 


a 2 ) 



n 为奇数 

/?2) … ）（w — 




m 


( 20 ) 
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c ，^和 ft 为适当选择的实参数 ， m =「 rz /21 _ 1。 事实上，有可能选择这些常数使得 

Pm = 0 o 

证明我们首先考虑当 c 固定时，可以在 （20) 中选定诸 a 和诸/9的情况，设 

p{x) = u{x — c ) = a + a n -\ X n[ + *** + a { x + (21) 

我们要来证明对于某个多项式及某常数‘， A ， p (: r ) 有 p x { x ){ x 2 ~ a m ) + 
&的形式。如果以： r 2 _ a w 来除 p ( x )， 我们可以看到仅当由 /) U ) 的每个奇数号 
系数形成的辅助多项式 

q ( oc ) = a 2m ^[^ m + CL 2 m - i ^ m ~ { + '** + (22) 

是 x - a m 的倍数时，剩余 A 才是一个常数。反之，如果 g ( x ) 有 x - a m 作为一个 
因子，则对于可以由除法确定的某个常数(:0(1 2 -〜）+心。 

类似地，我们要 h (: C ) 具有 p 2 ( x )( x 2 - + 的形式，而这等于说 

q ( x ) l(x - %)是 : c - 的倍数；这是因为，如果 g〆 :?:） 是对应于 h ( x ) 的多项 

式，如同 g (: c ) 对应于/)(工 ) 那样，我们就有 qi ( x ) - q ( x ) l(x ~ a m ) 0 依此类推，我 

们发现当且仅当 

q ( x ) = a 2m + i(x - a Y )'-(x - a m ) (23) 

时参数 a ' ，，… ， a m ， 才存在。换句话说，或者 g (: r ) 恒等于 0( 这仅当 n 是偶数 

时才会发生），或者 g (： r ) 是所有根为实根的 m 次多项式。 

现在我们有一个令人惊奇的由 J . Eve 发现的事实 [ Numar . MaA . 6 (1964), 17 〜 
21] :如果 p (: r ) 至少有 n ~ I 个其实部全为非负或全为非正的复根，则相应的多项式 
q ( x ) 恒等于零或根全为实根（见习题23)。 由于当且仅当 />(：r + r )=0 时 W (: c )= 
0,故我们只需要把参数 c 选择得足够大以使 W ( x )=0 的至少 n -1 个根有大于等 
于 - C 的实部即可，此时只要 a ,,-! = U n - X - 726^„尹0, （20) 将必定成立。 

我们也可以把 C 确定成使得这些条件都满足而且使& =0。首先确定^(^)= 

0的72个根。如果 a + ~是有最大或最小实部的一个根，且6关0,设 C = - a 和 

a m = 则 X 1 - a m 是 w (: c - c ) 的一个因子。如果有最小或最大实部的根是实 

数，但有第二个最小（或第二个最大）实部的根是非实数，则可应用同样的变换。如 
果具有最小（或最大）实部的两个根都是实数，则它们可分别表达成 a ^和 a 6 
的形式。设 c = - a 及 a m = b \ 再一次 x 2 - a m 是 m (: r _ c ) 的一个因子。 （ c 的其它 

值通常也是可能的，见习题24。）除非 x ) 恒等于0,否则系数〜叫将至少对于这 

些情况之一为非0。 ■ 

注意，这个证明方法通常至少给出两个 c 值，而且我们也有机会以 （m -1)! 种 
方式排列 q ，…，在各种可能的方式中，某些方式可能比其它一些给岀更合 

要求的数值精度0 

当然，当我们对整数模 w 而不是对实数进行处理时，不出现数值精度的问题。 
m 同2心互素时方案 （9) 对于 有效，而当 m 同6〃 6 及（17)的分母互素时， 
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方案 （16) 对 n = 6有效。习题44表明对于任何首一 n 次多项式模任何的， n /2 + 
0 (log n ) 个乘法和 OU ) 个加法就足够了。 



> 多项式链 现在我们考虑最优性的问题。就最少的算术运算次数来说，计算 
各次多项式 可能的最好方 案是什么呢？在不允许对系数预先改写的情况下，这个问 

题首先是由 A . M.Ostrowski 分析的 [Studies in Mathematics and Mechanics Presen ted 
to R . von Mises (New York ： Academic Press , 1954) ， 40 〜 48] •，在 改写系数的情况下， 

由 T . S . Motzkin 作了分析[见 Bu //. Anier . Math . Soc . 61 (1955) ， 163] 0 

为了研究这个问题，我们可以推广 4.6.3 小节的加法链概念成为多 项式链 。令 
多 项式链是形如 

x = A 0 , A , , 一， A r = u ( x ) 

的序列，其中 w (:^)是： r 的某个多项式，而且对于 

或者 A , = (± A ; ) 。 A 々， 0< j，k < i 

或者 A , = dj - X k , 0 ^ k < t 

这里“ 。” 表示三个运算 “ + 或 “X” 之一，而表示一个所谓参数。头一种类 

型的步称为链步，而第二种类型的步称为参 数步。 我们假定在每种参数步中使用不 
同的参数如果有 s 个参数步，则它们应当依次包含 ，…，^。 

由此得出，在链的末端的多项式 w (: r ) 有形式 


(24) 

(25) 


u ( x ) - q n x n + ••• + q { x + q 0 (26) 

其中〜，…， W 是具有整系数的0^，，…， a 、. 的多项式。我们将把数 q ， a 2 ，…， 
^解释为实数，因此我们限于考虑具有实系数的多项式的计算。一个多项式链的结 
果集合只定义为当，…，~独立地取所有可能的实数值时岀现的所有 实向董 



n > 


jhw ) 的集合 


o 


如果对于 t + 1个不同整数 jo , …， & 10,1. 


蠢鼴馨 


71 


的每种选择，有一个整系数 


非0多变量多项式/使得对于只中所有的 U ,， …， h ， go )，/ v ..;, U v …，％ ,) 

= 0,我们就说结果集合及至多有 f 个自由度，而且链 (24) 至多有 z 个自由度。我们 
也说，如果 U „， …，…， w ) 在尺中，则链 （24) 计算一个给定的多项式 uU ) 二 

w …+ w Q 。 由此得出，至多有 n 个自由度的 一 个多项式链不能计算所有 


的77次多项式（见习题27)。 

作为多项式链的一个例子，考虑当 


A 




n 为奇数时，对应于定理 E 的链 


义1 = “1十又0 



A 3 = m x Ai (27) 

Al 十3/ = a l +2/ + 久〕 

入 2 + 3; = a 2 + h + 久 2 > 1^ n /2 

久 3 + 3/ = 久 1+3/ X ^2 + 3/ ^ 
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有 LW 2」 十2次乘法和”次加法， U /2」+ 1个链步和” + 1个参数步。由定理 E ， 结 
果集合尺包括所有〜#0的（〜，…，心， W Q ) 的集合，所以 （27) 计算所有72次多项 

式。我们不能证明及顶多有〃个自由度，因为结果集合有 〃 + 1 个独立的分量。 

有 s 个参数步的多项式链顶多有 S 个自由度。 在某种意义上，这是显然的 ：我们 
不能用少于 Z 个任意参数计算有〖个自由度的一个函数。但这个直观的事实不容 
易形式地 证明； 例如，有把实线映射到一个平面的连续函数（“填满空间的曲线”），这 

样的函数把一个参数映射成两个独立的参数。为了我们的目的，我们需要验证任何 
整系数的多项式函数都不能有这样一个 性质； 一个证明见习题28。 

给定这一事实，即可着手证明我们寻求的结果。 


定理 M ( T . S . Motzkm ,1954 ) 具有 m >0个乘法的一个多项式链顶多有 2 m 个 
自由度。 

证明设是链中代表乘法运算的诸 A ,. ，则 



X S 2 i y 1 ^ z ^ m 

2 十 1 


(28) 


其中，每个4是诸"，诸： r 及诸 a 的某个和。令 S , = 7； +戽 ， 其中了 ; 是诸"和诸1 
的一个和，而爲是诸 a 的一个和。 

I 

现在 “（ I ) 可表达为具有整系数的： r ， ft ， …，/? 2/>1 + 1 的一个多项式。由于诸可 

表达为〜，…，〜的线性函数，故由所有实数值仏 ，…， ^ 2/n + 1 表示的值的集合包含 
链的结果集合。因此至多有 2 m + 1个自 由度； 习题30表明，当 m >0时这可改进 

成2 7?2。 ■ 


定理 M 的证明中提到的构造的一个例子见习题25。对于加法可证明类似的结 



定理 A ( E . G . Belaga , 1958) 一个含 q 个加法和减法的多项式链至多有 q + 1个 
自由度。 

证明 [PVobiemy iCi ’ bemet/’id 5 (1961),7 〜 15] 设 k ：〗 ，…，％是链中对应于加法 
或减法运算的 诸1 ，则 



1 < 2 < ^ 



其中每个 T 」 是诸 LX ，及诸 a 的乘积。我们可以写乃=，其中是诸 a 的乘 
积，是诸 / c 和诸： r 的乘积。现在对 z = 1，2,…，^可以对链作下列变 换：设 你= 
A 2/ / A 2 h ，使得〜 二 A 2 , ± B 2; — i ± 氏 B 2! ) 。 然后把改变 成为士 士 成 B 2 , , 

并用 A 2; ；_ 1 / c / 代入将来的公式 T 2 , + 1 ， T 2/ + 2 , …， T 2g + 1 中出现的每个 / c 7 (这个替换可 


以改变 A 2/ . + 1 


^2 i + 2 > …， A 2q + 1 的值）。 


在对于所有 z _ 完成了上述变换后，设 民 + 1 = A 2(? + !;则 w (: r ) 可以表达成具有整 
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系数的/51，"、民 + 1 和1的多项式。我们几乎已经完成了大部分的证明，但我们必 
须小心，因为当仏，… ，馬 + 1 跑遍所有实数值时，所得到的多项式不可能包括由原始 
链所表示的所有多项式（见习题 26); 对于诸 a 的某些值，有可能有而这 
使 ft 无定义。 

为了完成证明，我们注意到原来的链的结果 集合尺 可以写成尺= U 及 2 U … 

其中尺是当时可能的结果向量的集合，而是当诸 a 非0时 
可能的结果向量的集合。上边的讨论证明， f 至多有 C 7 + 1 个自由度。如果 
= 0,则了 1^=0,所以加法步 A 可以撤销，以得到计算结果集合尽的另一个链。 
由归纳法我们看到，每个兄至多有 g 个自由度。因此由习题 29,丑 至多有 (？十1 个 
自由度 。 i 


定理 C 如果对于某个，一个多项式链 （24) 计算所有 n 次多项式 u ( x ) = 
u n x n + ••• + uq ，娜它至少包括 L 〃/2」+ 1 个乘法和 n 个加减法。 

证明 设有772个乘法步。由定理 M ， 这个链至多有2772个自由度 ，所以 
77+1。类似地，由定理 A ， 有大于等于；1个加减法 。I 

这个定理指出，没有单个方法能用少于 LW 2」+ i 次乘法或少于〃个加法而计 
算出所有 n 次多项式。习题29的结果使我们能加强这个结论，并指出，没有有穷的 
这种多项式链的汇集能满足给定次数的所有多项式。当然，有些特殊的多项式可以 
更有效地计算。我们实际上已经证明的是，具有代 数无关 的系数（在它们不满足非 
平凡多项式方程这一意义下）的多项式，需要有 Ln /2」+ l 次乘法和 77 次加法。可惜 
的是，在计算机中，我们处理的系数总是有理数，所以上述定理实际上不 适用； 事实 

上，习题42表明， 0(/^) 次乘法（以及可能还有大量加法）总是够用了。从实用的 
观点看，定理 C 的上限可应用于“几乎所有”的系数，而且似乎它们可应用于所有合 
理的计算方案。此外，甚至在有理数的情况下，也有可能得到对应于定理 C 的那些 
下界 ：通过 加强上述证明 ， V . Strassen 指出，比如说，多项式 

u ( x ) = xk (30) 

卜 0 

不能用任何长度<一/ lg 72 的多项式链来计算，除非这个链至少有+72 -2 个乘法和 

n - 4个除法 [SJCOMP 3 (1974),128 — 149]。 （30) 中的系数非 常大; 但也有可能找 
到其系数仅为0和1的多项式，使得计算它们的每一多项式链对所有充分大的 〃至 

少含/^/(4 lg 〃） 个链乘法，甚至当允许参数~是任意复数时也是如此。[见 R . J . 

■ 

Li p ton , S 7 COMP 7 (1978),61 〜 69 ; C .- P . Schnorr , Lecture Notes in Comp . Sci . 53 
(1977),135~147 0 ] jean-Paul van de Wiele 已经证明，对于某个 c >0, 某个 0-1 多项 
式 的计算总共要 求至少 cn / log 72 次算术运算 [FOCS 19 (1978),159 〜165]。 

除了平凡的 n =2的情况外，在定理 C 的下限和已知可达到的实际运算次数之 
间仍然存在着距离。定理 E 给出 L 〃/2」+ 2 次乘法，而不是 Ln /2」+ 1次，尽管它确 
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实达到了极小加法次数。对于72=4和72 =6,我们的特殊方法有极小的乘法次数， 
但多了一次加法。当〃是奇数时，不难证明，对于乘法和加法，定理 C 的下限不能 
同时 达到； 见习题33。对于；2 = 3,5和7,有可能证明至少有 LW 2」+ 2 次乘法是必 
需的。习题35和习题36证明，当 n =4 或 n =6时，定理 C 的下限都不能 实现； 因 
此当 n <8 时，我们已经讨论的方法是最好的。当〃为偶数时， Motzkin 证明 
LW 2」+ 1次乘法是充分的，但他的构造包含不确定的加法个数（见习题39)。 V . Y . 
Pan 建立了对于72=8的一个最优方案，他证明了对于这一情况，当有 LW 2」+ 1个 
乘法时， ? 7 + 1个加法是必要和充分的。他也证明了对于所有偶数 n >10， L 〃/2」+ l 
次乘法和^+2次加法是充分的。 Pan 的文章 [ STOC ： 10 ( 1978)，162 〜 172 ] 也确定 
了对于所有次数〃，当计算整个地是对复数而不是对实数进行时，所需要的乘法和 
加法的精确极小次数。习题40讨论了当 的奇数值出现时的有趣情况。 

显然，我们对单变量多项式的链已经得到的结果可以毫不困难地扩充到多变量 
多项式。例如，如果在不改写系数的情况下要寻找多项式计算的最优方案，则我们 
可以把《 (: r ) 看做^ +2个变量 jr ，^，一，^，；^ 的一个多 项式； 习题38证明，在这 

种情况下72次乘法和〃次加法是必要的。其实， A . Borodin [Theory o / Machines and 
Computations , Z . Kohavi 和 A . Paz 编 （New York : Academic Press , 1971) ， 45 〜 58 ] 已 

经证明，霍纳规则 （2) 实际上是在 277 次运算中计算 W ( x ) 而不需要预先处理的惟一 
方式。 

稍作修改，上述方法即可推广到含有除法的链，即推广到多项式以及有理函数。 
奇怪的是，如果乘法和除法速度相等，甚至当允许预先处理时，从计算运算次数的观 
点看，霍纳规则的连分数模拟现在看来也是最优的（见习题37)。 

有时，在多项式的计算期间除法是有帮助的，尽管多项式仅仅借助于乘法和加 
法来 定义。 我们已经在多项式导数的 Shaw - Traub 算法中见到了一些例子。另一个 

例子是 

: T 72 + …+ + 1 

由于这个多项式可以写成 -1)/(： T -1)， 故我们可以通过 /(n + i ) 次乘法（见 
4.6. 3小节），两个减法及一个除法来计算它，而避免做除法的技术似乎要求大约三 
倍的运算（见习题43)。 


特殊的多变量多项式 一个77 X n 矩阵的行列式可以认为是 个变量％的一 

个多项式， 如果工 ^^0,则有 



(31) 

因此，一个 n 乂 n 矩阵的行列式可以通过计算一个 U - 1) X („ - 1) 矩阵的行列式 
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再加上 U -1) 2 + 1次乘法， （72 - I ) 2 次加法，及 W 1次除法来计算。由于一个2 X 
2的行列式可以用两次乘法和一次加法来计算，我们看到，几乎所有矩阵（即不需要 
除以0的除法的那些矩阵）的行列式可以用顶多 （2? -3 n 2 +7 n -6)/6 次乘法， 
(2 n J - 3 7? 2 + n )/6 次加法 ，以及 （ n 2 - n - 2)/2 次除法来计算。 

当出现0时，行列式甚至更易于计算。例如，如果 xu = 0但 x 21 #0, 则有 



0 

jt 12 … 

工 U 、 



^21 

工 71 … 

工 2 ” 


det 

义 31 

• 

9 

^32 … 

i 

m 

工 3” 

4 

1 

—- xo\ det 


争 

、 n 1 

% 

工 nl 

■ 

X J 



工12 

工32 -(工 3 l / 工 21)^22 


X 


712 





^ 1 n 

〜 — （工 3 l / l 21)〜 


X 


nn 




X nl \X 1Y )^ln 



(32) 

这里约简为 U -1) X (72 - 1) 行列式节省了在 （31) 中所用的 n - 1次乘法和77 - 1 
次加法，补偿了为认记这个情况所需要的额外的簿记操作。因此任何行列式都可以 


用大约次算术运算（包括除法） 计算。 这是值得注意的，因为它是有 77! 个项的 
一 个多项式而且每项有 n 个变量。 

如果我们要计算一个整元素矩阵行列式， （31) 和 （32) 的过程显然是没有吸引力 
的，因为它要求有理算术。然而，我们可以使用这个方法来计算行列式模 〆 对任何 
素数因为除法模 p 是可能的（习题4.5.2-16)。如果对于充分多的素数进行了 
这一计算，则这个行列式的精确值可以如同在 4.3.2 小节中所说明的那样求得，因 
为阿达马不等式 4.6.1-(25) 给出了这个量的上限。 

—个 nX n 矩阵 X 的特征多项式 det(xl - X )的系数也可在 0( n 3 ) 步内 计算; 

见 J . H . Wilkinson , The Algebraic Eigenvalue Problem ( Oxford : Clarendon Press , 

1965),353 〜 355,410 〜411。习题 70 讨论了一个涉及 O ( n 4 ) 步的有趣的不用除法 
的方法。 

一个矩阵的 积和式 是非常类似于行列式的一个多项式，惟一的差别是它的所有 
非零系数是+ 1。于是我们有 


工11 

per : 

1 


工1 7? 



X 


nn ) 





其中求和是对 U ，2,…，〃丨的所有排列 jij 2 〜 j n 进行的。这个函数似乎应当比看来 

更复杂的行列式要容易计算，但却没有已知的办法来像行列式那样有效地计算它。 
习题9和习题10证明，对于很大的 n ， 大大地少于 〃丨次 运算就足够了，但是所有已 
知的方法的执行时间仍然随矩阵的大小以指数增长。事实上， Leslie . G . Valiant 已 
经证明，如果我们忽略计算的运行时间的多项式因素，则计算一个给定的 0-1 矩阵 
的积和式，就同计算一个不确定的多项式时间图灵机所接受计算的个数一样困难。 
因此，对于积和式的一个多项式时间的求值算法将意味着，大量不能用有效解法求 
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解的其它著名的问题将可在多项式时间内求解。另一方面， VaUaru 证明，对所有 
6>2,一个 n 乂 n 的整数矩阵的积和式可以在0(/〃 3 )步内在模/下进行计算 
L 丁 IworeticaJ Comp . Sci . 8 (1979) ， 189 〜 201 ] 。 

涉及矩阵的另一个基本运算当然是矩阵乘法 ：如果 X = U / y ) 是一个 mX ” 矩 

阵， Y =( w ) 是一个矩阵，且 Z =( n ) 是 一个 ” z x 5 矩阵，则公式 Z = XY 意 

味着 

；/ 

z tk = X ) 工 , 扉， I ^ I ^ 771 , 1 < ^ ^ 5 (34) 

这个等式可以认为是 W 个变量的个联立多项式的计算，每个多项式是两 
个，/位向量的“内积”。一个直接的计算将含个乘法和 77 U(n - 1) 个 加法； 但 
S . Winograd 在1967年发现，有一个方法来把大约一半的乘法换成 加法： 

z ik 二 2 ( x i ,2 j + + yij , k ) - - bk + ua [” 为奇数] 

i«，“l 

a i = x i , ij x i , ij - \ 5 — S yij -'、 ky 2 j，k (35) 

这个方案使用 「 nj 2 ~\ms + L n/2j ( m + )次乘法和 （” + 2 ) ms + ( L nj 2] ~ l)(ms + m 

+ s ) 次加法或 减法； 总的运算次数稍微增加了，但乘法的次数大约已经折半[见 
IEEE Trans. C - 17 (1968),693 — 694]。 Winograd 的令人惊奇的构造导致许多人更 

仔细地考虑矩阵乘法的问题，而且激起广泛的猜测，即为了进行 nx n 矩阵乘法， 
« 3 /2次乘法将是必需的，因为对于一个变量的多项式已知有类似的下限成立。 

Volker Strassen 于1968年发现了对于很大的/ 2 的一个甚至更好的方案。他找 
到一个方法，可以只用7次乘法而不必像在 （35) 中那样依赖于乘法的可交换性，来 
计算 2 X 2 矩阵的乘积。由于 X 2 n 矩阵可以划分成四个 x n 矩阵，利用他的思 
想可以只用公次乘法而不是 （2” 3 = M 次乘法来递归地得到 2 k 乂 2 k 矩阵的积。加 
法的次数也以公的阶增长 。 St r assen 原来的 2x2 恒等式 [Numer. Math. 13 
(1969),354 〜 356] 使用7次乘法和18次 加法； S . Winograd 后来发现了下列更经济 
的 公式： 

丨 a b \( A C \ I aA + bB zv + v + (a b ~ c - d) D 、 

\ c d I \ B D I Vie; + u + d {B ^ C~A ~ D) zv u + v / 

(36) 

其中 《 = - D) , v = (c + d)(C ~ A) y iv ~ aA + (c + d~ a) (A + D~ 

C)o 如果适当地保留中间结果，则 （36) 含 7 次乘法和仅15次 加法； 对 A 用归纳法， 
我们可以用 V 次乘法和 5(7+ - V ) 次加法来乘 2 k X 2^矩阵。因此为乘 n x n 矩阵 

所需要的运算总数已经从 阶减少成 0(〃 lg7 ) = 0 U 2 8G74 )。 类似的减少也可应 
用于计算行列」 I ： 和矩阵 的逆； 见 J,R. Bunch 和 J . E : Hopcrof Comp. 28 

(1974),231-236, 

Strassen 的指数 lg 7 在 1978 年之前一直得不到改进，直到 Viktor Pan 发现它可 
以降低到1呢 7() 143640〜2.795(见习题60)为止。这个新的突破导致了对这个问题 
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的进 一 步深人的分析，而且 D . Bird ， M ■ Capovani ， D • Coppersmith ， G . Lotti , F . 
Romani , A . SchOnhage , V . Pan 以及 S . Winograd 共同的努力最终得到了渐近运行时 

间方面的显著减少。习题60〜67讨论了用来确立这些上限的一些有趣的技术。特 
别是习题66包含了 OU 2 55 ) 个运算就足够的一个相当简单的证明。到1997年已 

知的最好上限是0 ( ?7 2 376 ) ，它是由 Coppersmith 和 Winograd 给出的 [ J . Symbohc 

Comp . 9 (1990),251 〜280]。与此相对照，当前知道的最好下限是 2 n 2 - 1( 见习题 
⑵。 

这些理论的结果是十分引人注目的，但是从一种实用的观点看，它们的用途有 
限，因为 n 必须很大才能抵消额外的簿记代价 。 Richard Brent [斯坦福计算机科学 
报告 CS 157(1970 年3月 ) ，也见 Numer . Mad , 16 (1970) ，145〜 156] 发现，仅当 7 i > 

40时， Winograd 的方案 （35) 的精细实现，连同为保持数值稳定性的适当比例因子， 
才变得比通常的方法更好，而且当77 =100时，它只节省大约7%的运行时间。对于 
复数算术情况稍有不同，当 n >20时 （35) 就变得有利了，而且当” =100时节省 
18%的运行时间。他估计，在？?々250之前， Strassen 的方案还不会超过 （35) ;而且 
这样庞大的矩阵，在实践中很少出现，除非它们非常稀疏，而这时可使用其它技术。 
而且，阶为 n ' 其中 oj <2.1 的已知方法有相当大的比例常数，使得在它们战胜方案 

(36) 之前，需要10 23 次以上的乘法。 

相反，我们下边将讨论的方法非常实际并已发现有广泛的用途。在分别具有 
?7 U ， …， 个元素的区域上个变量的复值函数 F 的一个离 散傅里叶变换 /，由下 

列等式定义：对于 ()<&< 1 , * * * y 0^： S n < m n , 






exp 





(37) 


“变换”这个名字是正当的，因为如同习题13中所示，我们可以由值/(^，…，〜）恢 
复值 F ( q ， …，~)。在所有 m 】 二 1 的重要特殊情况下，对于，…，我们 
有 

/(〜，…， O = S (- ，…，〜 ） （38) 

0 彡 v 

而这可以认为是 2” 个变量 F( q ，…，~)的 2” 个线性多项式的联立求值。 R Yates 

给出的 一 个著名技术 [TT^e Design and Analysis of Factorial Experiments (Harpenden ： 
Imperial Bureau of Soil Sciences, 1937 )] 可以用来把隐含于 （38) 中的加法数从 
2”（2〃_ i ) 减少成 m 2”。考虑 a =3的情况可以理解 Yates 的方 法：设 a 。 = FU " 


给定 第一步 第二步 

工 000 工 000 + ^001 ^000 + ^001 + J :010 + 工 0U 
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第三步 

工 000 + 工 om + 义 010 + 烹 on + ^ioo + ^ 101 + x no^ 
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^001 ^010 + ^()1 1 

工 010 1100+101 

^01 L 丄 110 + 

^100 ^000 _ ^001 

:101 x 010 — J ou 

^JIO ^100 _ 1 101 

^ : iio ‘ r m 


+ x loi + + x in 

‘ r 000 — 工 001 + 工 010 一 x 0\\ 

工 loo 一了 loi + J no^ 1 in 
工 000 + 工 001 一 了 OK) — ^011 

^100 + ^101' ^110~^m 

J _000' r 001 一 丄 010+ J 011 
x ioo 一 x m ~ 工 1 川十 了 111 


:000 — 了 001 + ^010 " 工 Oil + ^ 100 ~ J 101 + 了 LL0 — x lll 

^000 + J 001 一了 010 一 ^ r 0ll + ^100 十 Z 101 一 了 110 —工 iu 

丄 coo — 上 001 — 丄 010 + 工 cni + x m 一 工 loi — 工 no + 工 ill 

‘ r ooo + a ’ooi + ‘ r oio + iou — r ioo" - r ioi 一工 no 一 工 m 
iooo 一 T ooi + x oio ~ 工 ou 一 ^ioo + J ioi ^ x uo + x \n 
■^ooo + x om ~ :oio — J mi — * r ioo~ j; ioi + ino+ 工 ni 

工 000 — 工 001 — 工 010+ ^oii ~ x ioo ^ J ioi + 工 110 一 J m 


为了从“给定”达到“第一步”，需要四次加法和四次减法。 Yates 方法的有趣特征是 
使我们从“给定”到达“第一步”所进行的变换同样使我们从“第—步”到达“第二步” 
和从“第二步”到达“第三步”。在每种情况下，我们做四次加法，然后四次减法；而且 
在三步之后，我们在原来由 S 3 ) 所占据的位置上幻术般地有了所希望的傅 


里叶变换/ ( O ， . s 3 ) 。 

这个特殊情况通常称做 2" 个数据元素的 阿达马变换 或沃尔 什变换 ，因为对应 
的符号模式是由 J . Hadamard [Bali Sci . Math. (2) 17 (1893) ， 240 〜 246 ] 和 J ‘ L . 
Walsh [ AmerJ . Math . 45 (1923)，5 〜 24] 研究的。注意，在上边的“第三步”从左到右 

符号变化的个数分别为 

0,7,3,4，1，6,2,5 

这是数10,1，2,3,4,5,6,7丨的一个排列。沃尔什发现，如果我们适当地排列变换的 
元素，则在一般情况下将恰有0，1, …，2 ” -1 个符号变化 ，所以 这些系数提供了对于 
具有各种频率的正弦曲线的离散近似。（关于阿达马-沃尔什系数的进一步讨论见 
7.2.1.1 小节。) 

Yates 的方法可以推广到任何离散傅里叶变换的求值，而且事实上可以推广到 
能写成一般形式 

/ ( S 5 2，…， 5 ，! ） 二 

2 gi(^l , 5 2 , , ^^^2( ^'2 - S V / ^2)***^(*^； ^2 

0 ^ J < m ^ 


0^ ( < m 

的任何和集求值，其中0<\< ;义，函数 A ( s ; ，…，〜，~)是给定的。具体进行如下: 


fo(t\ ， t 2 ， t 3 ， … ， t n ) = F(M ， t 2 山， 





s 





fn ( ~ ， $ 2 ，， 






，心） 


fn ( ^ I ， 52”f.，0 


( 40 ) 


对于如上所亦的 Yates 方法 ， gj ( \ ，…， s r " tj 


- 1 ) 


;/o ( ,1 ，艺 2 ， ,3 ) 表不给定； 


表示“第一步”，等等。每当对于相当简单的函数 gi ( s ，， 


秦參鲁 ^ 

y 


A 


所求的和集可以写成 （39) 的形式时，方案 （40) 将把计算的数量的阶从 N 2 减少到 


N log N 左右，其中 N 




m 


m n 是数据点的 个数； 而且这个方案对于并行计算也 


很理想。习题14和53中讨论了一维傅里叶变换的重要 情况； 我们在 4.3.3 C 小节 
中也考虑了一维的情况。 

我们考虑多项式计算的一种更特殊情况。 n 阶拉 格朗日内插多项式 可写成 


U in] 


X 


yo 


{x - X[)(x - jt 2 ) …（: r — x n ) 


(x 0 - xi)(x 0 - jt 2 )."(x 0 — ) 



X 


y\ 


X 


工 0)( 


工 0)( 


X 


^2 ) '•' ( X - 


x 2 ) …（: r 1 


X 


+ 



X 


X 


yn 


io )( 


X 




k « » f 

\ 乂 乂 乃一 i 




x 0 )( x n - x y )- 9 ( x n - X n ^i 


(41) 


它是: r 的次数 <72 的惟 一 多项式，它在71 + 1个不同点 ：c 


工0，工 


值 


: 


y”o (因为由 （41) 显然可知，对于有 u [ n ] ( x k 


, x n 处分别取 
) = 1。如果 


/(: r ) 是次数的任何这样的多项式，则 g ( 


X 


fix ) - w [〃] (: r ) 的次数 <72，而且 


对于 JT =工0，11， 


，: T”，g (: C ) 为 0;因此 g ( X ) 必定是多项式 （：C - Xq )( j 0 - 



參 ■ 


X 


A ) 的倍数。后一多项式的次数大于77,所以 gU 


0。）如果我们假定在某个表 


中一个函数的值可以用一个多项式很好地近似，则拉格朗日公式 （41) 可用来在表中 
未出现的点 X 处“内插”函数的值。拉格朗日于1795年向他在巴黎师范大学的学生 
介绍了 （41) [见他的 ( I^vres 7 ( Paris ： 1877) ，286];但是剑桥大学的 Edward Waring 
实际上应得这个荣誉，因为他在 Rhiiosop / iica / Transactions 69 (1779)，59〜67中就已 
经十分清楚明晰地给出相同的公式。 

看样子在 Waring 和拉格朗日的公式中有不少的加法、减法、乘法和除法。事实 


上，恰有 n 次加法， 2 n 2 +2 n 次减法，2；2 



n 


1次乘法及 n + l 次除法。但幸而 


(如同我们现在有条件猜想的那样）有可能进行改进 


o 


简化 (41) 的基本思想是利用以下的事实 ：对于 X 二 


> ，乂 M 一 I 


U [n] 


X 


) _ ^\ n-W 


X 


0 


于是 U [ n ]{ x ) - m i ；j ( ) 是 n 次或更少次的一个多项式，而且是 （: r - ， ) 


4 鼸 4 


X 




)的 




个倍数。我们结论& 


X 


= a^ix - x 0 ) 


♦ ■籌 


{X ~ X n - V 



u 


[w - L ] (工 


) ，其 


中^是一个常数。这就导致 牛顿内插公式 

“U](I) = 〜 （工 - x 0 )(x ― 


x ) — a 


x 


- x fl - { ) + 



a 2 ( x ~ Xq)(x - X]) + a ^ ( x - Xq ) 





(42) 


其中诸 or 是我们要从给定的:? : Q ，^，…， ，_ y Q ，％ 
个公式对于所有 w 成立； 系数 A 不依赖于 n +1 ， 


，>确定的某些系数。注意，这 


，及，或: ^ + 


旦诸 a 已 
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知，牛顿内插公式就便于计算了，因为我们可以再次推广霍纳规则并令 

=((…（〜（工 - x n . { ) + a ,, hK ：?: - x tl . 2 ) + ^-)(x - Xq ) + a 0 ) (43) 

这要求72次乘法和 2 tz 次加法。或者，我们可以从右到左地计算 （42) 的每个个别 
项; 这样用 2 n - 1次乘法和 2;?. 次加法就可以计算所有值 u [0] ( x ) iU [ l ] ( x ) r -, 

ui n ]{ x ) ，而这表明一个内插过程是否收敛。 

通过在下表中（这里示出 72=3 的情况）计算均差，可以求出牛顿公式中的系数 


: 


^0 

3^1 

3^2 

^3 


(^i _ yo)K^[ - ^o) = y\ 

(yi ~ )/(^2 — ^ 1 ) ~ yi 

(^3 - yi)Koc^ - x 2 ) = y\ 


(y ’2 - y\)i (^2 

(y\ ^ y’ 2 ) 丨 （A 


^o) = y\ 

^ 1 ) = y \ 


(/ 3 


// 

~ 3^2 



(44) 


有可能证明 a ^ = a x = ：y;，a2 = ：y〗， 等等，并证明均差同被内插函数的导数有重要 

关系； 见习题15。因此下列计算（对应于 （44)) 可用来得到诸 a: 

由 （Qf 0 ， A ，…， 〜 ）—（3^0 ，3^，…，3^ ) 开始； 

然后对于々=1，2,…， n (按这个顺序）， 

对于 j 二”，” - 【，…，々（按这个顺序），置 〜 —Qj - i)l (xj — Xj - k ) o 


这个过程需要 + U 2 + n) 次除法和 n 2 ^ n 次减法，所以大约节省了 （41) 的工作量的 


四分之三。 

例如，假设我们要用一个三次多项式从0!，1!，2!和3!的值估计1.5!。均差是 


X 


y y" 


0 



2 





0 


2 




4 


// 



/// 

y 



所以 




1，以 [2] 




1) + 1 ， U[ 3 ](x 



x(x - 1)(x 





2 


x{x - 1) 



在以 [3] (: r ) 中置 ： r = 1.5 给出- .125+ .375 + 1 = 1.25; 可以 


推测“正确”的值是 r (2. 5) = |1.33。（但是当然有许多其它的序列，它们也以 
数1，1，2和6开始。） 

如果我们要对若干个多项式进行内插，这些多项式有相同的内插点…， 

A ，但有不同的值，…，％，则以 W • J . Taylor 所建议的形式 [ J . Research Nat . 


Bur . Standards 35 (1945) ， 151 〜 155] 重写 （41) 是合乎要求: 


^ [ n 



3 ^o 



X 


^0 




(45) 
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当 x $ ! jt 。 ，&，…，:丨时，其中 

w k = 11( 工 k 工 0) …（工々 - - 工川）‘"（工々 - A ) (46) 

为了其数值稳定性，也建议米用这个形式[请见 P . Henrici ,£ ssent / a/s of Numerical 
Analysis (New York ： Wiley 1982 ) ， 237 〜 243 ] 。 （45 ) 的分母是1/(工-々）（1- 

- 的部分分式展开。 

Adi . Shamir[CACM 22 (1979) ，612〜 613] 发现了多项式内插的一个重要的和 
令人惊奇的应用，他发现多项式模 p 可用来“分享一个秘密”。这意味着我们可以设 
计一个密钥或口令系统，只要掌握这个系统中的任何〃 H- 1把钥匙就能有效地计算 
能打开（比方说）一个门的魔数 iV ， 但是只掌握任何；7把钥匙却不能得到任何关于 
N 的信息。 Shamir 给出了对这问题的简单得令人惊讶的解，他选择一个随机多项式 

w ( x ) = u n x v +…+心工十 w 0 , 其中 p 且户是一个很大的素数。秘密的每一 

部分是在 0<: r </) 范围中的整数/)，连同 w ( x ) mod p 的值； 而且超秘密的数 N 是 
常数项给定 n + 1 个值以: T ,)， 我们可以通过内插导岀 N 。 而如果只给了 72个 

值，则存在惟一的具有给定常数项的多项式 w ( x )， 但它在处有同 

样的值。因此这 n 个值并不能使某个特定的 iV 比任何其它值更有可能性。 

注意，计算内插多项式恰好是 4.3.2 小节和习题 4.6.2-3 的中国剩余算法的 
—个特殊情况，因为我们知道(: c ) 模诸互素多项式 x - _ r Q ， …，: r - ^的值。 

(如同我们在 4.6. 2小节中看到的， / U ) mod ( x -^ 0 )= /(，）。）在这个解释之下， 

牛顿的公式 (42) 正好是等式 4.3.2-(25) 的“混合进制表 示”； 而且 4,3.2-(24) 提供了 
用和 （44) 相同的运算次数来计算，，…，^的另一个方法。 

应用快速傅里叶变换，有可能把内插的运行时间减少成为 OU(log n ) 2 )， 对于 
有关的算法，例如解中国剩余问题和计算 n 个不同的点处72次多项式的值，也可相 
应地缩减运行时间。[见 E . Horowitz , Inf. Ptoc. Letters 1 ( 1972),157 — 163; A . 
Borodin 和 R . Moenck , J. Comp ‘ Syst . Sci . 8 ( 1974 ) ， 336 〜 385; A ‘ Borodin , 
Complexity of Sequential and Parallel Numerical Algorithms, J . F . Traub 编 （New 
York : Academic Press , 1973) ， 149 〜 180; D . Bini 和 V . Polynomial and Matrix 
Computations 1 ( Boston — rkMuser ，1994) ，第 1 章。]然而这些发现主要是有理论意 

义，因为这些已知的算法都有相当大的开销因子，使得它们没有吸引力除非当 ^ 很 
大时 D 

由 T . N . Thtele 于1909年给出的对于均差方法的一个重要推广，既可应用于多 

项式也可应用于多项式的商。在 L . M . Milne - Thompson 的 Calculus of Finite 
Differences ( London : MacMillan ，1933) ，第 5 章中讨论了 Thiele 的“倒数差” 方法； 也 
见 R . W . Floyd , CACM 3(1960) ，508。 

* 双线性形式 我们在本小节中已经讨论的好多个问题是计算一 组双线性形式 

的一般问题的特殊情况。双线性形式是 

” )) 

z k = 2 ^ ijk x iyj y \ ^ k ^ S (47) 

i = 1 j — 1 
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其中^是属于某一给定域的特定系数。三维数组（〖,>)称为 m . X n X s 张量，我们 
可以把它写成 s 个 m X n 矩阵，即对每个々值写一个矩阵。例如，复数乘法问题，即 

计算 

之 1 十 i 之 2 = ( 工 1 十 i 工 2)()1 十以2) 二(工 _ 上2"2) + + ^'2 y \) (48) 


的问题，是计算由 2 X 2 X 2 张量 


/I 

\0 


0 \ 

/0 1\ 

-1/ 

U 0/ 


确定的双线性形式的问题。在 （34) 中定义的矩阵乘法是计算对应于一个具体的 
mn X ns X 7 ? u 张量的一组双线性形式的问题。如果我们令诸工是常数而不是变量, 

那么傅里叶变换也可铸入这个模型中，尽管它们是线性的而不是双线性的。 

如果我们限定于可称做规范 （ normal ) 的计算方案，则双线性形式的计算最容易 
研究。在这种方案下，所有链的乘法在诸^的一个线性组合和诸 J 的线性组合之间 
发生。于是，我们构造 r 个乘积 

vjt - [十…+ )(^/ 3 ^ + …+ b nl y n ) , 1 < / < r (49) 


并得到诸 z 作为这些乘积的线性组合 

z k =⑴叫 + …十 c kr w r , (50) 

这里所有的 a A 和 e 都属于一个给定的系数域。比较 (50) 和（47)，我们看到一个规 
范的计算方案对于张量是正确的当且仅当对于1< 2 <川，1< ; <72及 


t ijk = + …+ a jr b jr c kr (51) 

我们说一个非0张量 U #) 的秩 （ rank ) 为1 ， 如果有三个向量 U 〖，…， ‘）， 

( 心，…，6，, ） ， （ q ，…， ) 使得对于所有 i , j y k y t ijk — ajb ： v . 通过说 （&) 的秩是使得 

( t @) 可表达为给定域中 r 个秩为 1 的张量之和的极小数 r ， 我彳 nm 可把这个定义推 

广到所有张量上。把这个定义同等式 （51) 作一下比较，即表明一个张量的秩是在对 
应的双线性形式的规范计算中链乘法的极小个数。附带指出，当 .9 = 1 时张量 

仅仅是一个通常的矩阵，而为一个张量的秩和作为一个矩阵的秩相同（见习 
题49)。张量的秩的概念是由 F . L . Hitchcock 在 J . Mafii . and Physics 6 (1927) , 164 

〜 189中引 进的； 它对多项式计算的复杂性的应用是由 V . Strassen 在一篇重要的文 


章中指出的， Cre"e 264 (1973) ，184〜202。 

关于矩阵乘法的 Winograd 方案 （35) 是“异常的”，因为在做乘法之前，它把诸： f 
和诸: y 混合起来。另一方面, Strassen - Winograd 方案 （36) 并不依赖于乘法的可交换 
性，所以它是规范的。事实上， （36) 相当于对于 2 X 2 矩阵乘法用下列方式来把 4 X 
4 X 4 张量表示为7个秩为1的张量 之和： 


1 0 0 0 ] 


0 0 0 0 、 


0 0 10 ) 

1 

J 

，0 0 0 0 、 


^ 0 0 01 

0 10 0 


0 0 0 0 


0 0 0 1 


0 0 0 0 


0 0 0 0 

0 0 0 0 


10 0 0 


0 0 0 0 


0 0 10 


0 0 0 0 

.0 0 0 0 . 


.0 1 0 0 > 


.0 0 0 0 , 


.0 0 0 1 . 


,0 0 0 0 . 


1 0 0 0 、 


1 0 0 cn 


1 0 0 0 N 

0 0 0 0 


0 0 0 0 


0 0 0 0 

0 0 0 0 


0 0 0 0 


0 0 0 0 

.0 0 0 0 , 


.0 0 0 0 , 


.0 0 0 0 , 
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ro 0 0 01 ro o o oi ro o o oi ro o o oi ro o o oi ro o T n ro o o oi ro o T n 
0 1 0 0 0 0 0 0 0 0 0 0 I 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 

0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 00 lT 0 0 0 0 o 0 1 I 

0 0 oJ lo 0 0 0> lo 0 0 0J lo 0 0 oJ lo 0 0 oJ lo 0 0 oJ lo 0 0 oJ lo 0 0 0/ 

， oooo] ro o o oi ro o o 0] ro o o oi ro o o oi ro o o oi [oooo] fo o o o N 

0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 

0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 + 0 0 0 0 0 0 0 0 To 10 To 1 0 + 

<0 0 0 oJ ll 1 1 T J lo 0 0 0 J lo 0 0 oJ lo 0 0 oJ lo 0 0 oJ [y 0 1 0 J 0 1 0 , 

oooo] ro o o 0] [oooi] [oooo] [oooo] [To i Tl flo i Ti [Toil 、 

0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 ;0 0 0 0 

0 0 0 0 0 0 0 0 0 0 0 了 0 0 0 0 0 0 0 0 1 0 1 1 1 0 T 1 1 0 I 1 

、ooooJ LooooJ lo o o lj LooooJ lo o o oJ [i o 1 1 J u o T i J a o I i , 

(这里了表示 -1。） (52) 

(51) 是关于 mk 对称的并且在各种各样的变换之下不变，这一事实使得我们 
很容易用数学方法研究张量的秩，而且它也导致关于双线性形式的某些令人惊奇的 
结果。我们可以把下标 l，J，k 加以排列，以得到“转置的”双线性形式，而且转置的 
张量显然有同样 的秩; 但对应的双线性形式在概念上十分不同。例如，用于计算 （772 
x 72 ) 乘 X d 的矩阵乘积的规范方案意味着存在一个使用同样数量的链乘法来计 
算 Uxd 乘 Gx m ) 的矩阵乘积的规范方案。在矩阵术语中，似乎这两个问题几乎 

全然无关——它们包含对不同大小的向量的不同数量的点积——但在张量的术语 
下它们是等价的。[见 V . Y . Pan,Uspekhi Mat . Nauk 27,5(1972 年 9 月 一10 月）， 
249〜250; J . E . Hopcroft 和 J . Musinski , SI COMP 2 (1973) , 159〜173。 ] 

当张量可以表示为 r 个秩为1的张量的和 （51) 时，命 A ， B ， (：是大小分别 
为 m X r ，X r , s X r 的矩阵 （) ， （ 心 ） ， （) ;我们将说 A , E , C 是张量 （) 的 一 
个实现。例如， （52) 中 2 X 2 矩阵乘法的实现可以由矩阵 

0 To 0 1 Ti [1 0 0 ITo 1 ] ri 1 0 0 0 0 oi 

0100010 0101000 1011001 

A 二 一 B = C = (53) 

0010111 ’ 0011101 ? 1000111 

.0 0 0 1 1 TiJ io 0 TIo 11 J Uoioioi 

确定。 

通过把张量的下标结合在一起， 一 个 X 72 X 5张量 0#) 也可表示为 一 个矩 
阵。我们将以表示 m/2 x 5 矩阵，它的行以下标对〈 2 ，》作为下标，而它的列 
以々作为下标。类似地， Uww ) 代表 .s，X 矩阵，它包含 t ijk 于 k 行和 列中; 
Guh ) 是一个 繼乂 n 矩阵，等等。一个数组的下标不必是整数，这里我们用有序对 

作为下标。我们可以使用这个记号来推导下列关于一个张量的秩的简单而有用的 
下限。 

引理 T 设 （ A ， B ， C ) 是一个 mX n x s 张量 （) 的实现，贝 1 j rank ( A ) ^ 
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rank ( t iijk) ) 


,rank(B )>rank( ~ ⑻） ，且 rank( C)^rank( t k(jj) ) •，因此 
rank(i^) > max(rankU,( ，））， rank(~ ( “ ））， rank(&("))) 


证明由对称性只须证明 r > rank ( A )> rank ( ~(#)) 。由于 A 是一个 m X r 矩 
阵，显然， A 不能有大于 r 的秩。而且，按照（51)，矩阵 U w ) 等于 AQ ， 其中 Q 是 
由= bjic k/ 定义的 r x ；75矩阵。 如果： c 是任何使得 : rA = 0的行向量，则 xAQ 
二0,因此在 A 中的所有线性相关性在 AQ 中也出现。由此得出 rank ( AQ ) < 

rank ( A )。 | 


作为使用引理 T 的一个例子，我们考虑多项式乘法的问题。假设我们要把一个 
一般的二次多项式乘以一个一般的三次多项式，得到乘积的系数 


(: co + x 


1 U + X2u 







Zq + Z[U + 之 2 以 2 十之 3 以 3 + 之 4 以 4 十 Z^U 5 

这是计算对应于 3 x 4 x 6 张量 


(54) 


10 0 0 
0 0 0 0 

0 0 0 0 . 


0 10 0、 


0 0 10、 

10 0 0 


0 10 0 

0 0 0/ 


.1000. 

0 0 0 0、 


0 0 0 0' 

0 0 0 1 


0 0 0 0 

.0 0 10. 


.0 0 0 1, 


0 0 0 1 
0 0 10 
、0 1 0 0J 



的六个双线性形式的问题。为了简便，我们可以把 （54) 写成 x ( u ) y ( u ) = z ( u )^ 
: r ( w ) 表示多项式^0+ + : r 2 ?， 等等。（我们又回到了在这一小节开始时的老 

地方，因为等式 （1) 指的是〃（: r ) 而不是 x (〃）； 我们换了一种表示方法，因为多项式 
的系数现在是我们所感兴趣的变量。） 

如果 （55) 中的六个矩阵的每一个被认为是以 G ， 乃作为下标的长度为12的一 
个向量，显然这些向量线性无关，因为它们在不同位置中非零。因此由引理 T ，（55) 
的秩至少是6。相反，通过仅仅做六个链乘法，例如通过计算 

■ r (0)： y (0)，: r ( l )： y ⑴，…，工(5)》(5) (56) 

有可能得到系数，…，以，这给出 z (0)， H 1)， …， 2(5) 的值，而且上边为了内 

插而建立的公式将产生 zU ) 的系数。： c ( j ) 和 jG ) 的计算可以完全借助加法和/或 
参数乘法来进行，而且内插公式只采取这些值的线性组合的形式。因此，所有链乘 
法如 （56) 所示，而且 （55) 的秩是6。（当在算法 4.3.3 T 中乘高精度的数时，我们实 
质上使用同样的技术。） 

结果，上一段中概述的 （55) 的实现 （ A ， B ， C ) 是 
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1111 1 1 
0 1 2 3 4 5 
0 1 4 9 16 25 


11111 


0 12 



4 


11 
5 


0 1 4 9 16 25 
0 1 8 27 64 125 J 


120 


0 


0 


0 


0 


0 


-274 600-600 400-150 24 
225-770 1070-780 305-50 
-85 355-590 490-205 35 
15 -70 130-120 55-10 


-1 


5 -10 


10 -5 


1 J 


X 


1 


120 


(57) 

于是，这个方案确实实现了极小的链乘法个数，但它完全不实用，因为它包含了这么 

多加法和参数乘法。我们现在将研究由 S . Winograd 提出的生成更有效方案的一个 
实用方法。 

首先，当 deg ( x ) = m 和 deg ( 3O = ”，且当是任意？?？ + n 次首 一 多项式 
时，为计算：的系数，可以使用恒等式 

x(u)y(u) = (x(u)y(u) mod p(u)) + x m y n p ( u ) (58) 

多项式 / Kw ) 应当选择成使得 x{u) y(u) mod 的系数易于计算。 

其次，当多项式/>(“）口1以分解成 g ( w ) r ( w )， 其中 gcd (q(u),r( 11 )) = 1时，为 
计算： rUbU ) mod pU ) 的系数，可以使用恒等式 

x(u)y(u) mod q(u)r(u) = (a(u)r(u)(x(u)y(u) mod q(u)) + 

b(n) q(u)(x{u) y(u) mod r(u))) mod q(u)r(u) (59) 

其中 a(u)r(u) ^ b(u)q(u) == 1; 这实质上是中国剩余定理应用于多项式的情况。 

第三，通过使用平凡的恒等式 

x{u) y{u) mod p(u) = (x(u) mod p(u)) (y( u) mod p(u)) mod p ( u ) 

(60) 

我们总能计算多项式: rU )： yU ) mod _ pU ) 的系数。如同我们将看到的那样，重复 
应用（58)， （59) 和 （60) 会产生有效的方案。 

对于例子(54)，我们选择 p(u) = u 5 ~ u 并应用 （58); 作这一选择的原因看下 
去就会明白。令/> (w ) = w ( w 4 _ 1) ， 则规则 （59) 归结为 

x{u) y(u) mod u(u 4 - 1) = ( — ( u 4 - l)x Q y 0 + 

u 4 (x(u)y(u) mod (u 4 - 1))) mod (u 5 - u) (61) 

这里我们使用了 x(u)y(u) mod w = 判⑽这一 事实； 一般来说，以使 / >(0)=0 这样 

的方式来选择 ^ U ) 是一个好的想法，这使使用上述简化成为可能。如果我们现在 

能确定多项式 x(u)y(u) mod ( w 4 - 1 ) =叫+叫 w +加 2 w 2 + w 3 的系数, 

^ 3 ，我们的问题就将获解，因为 

u 4 (x( u) y(u ) mod (u 4 - 1 )) mod (u 5 - u ) - + vo x u + zv 2 u 2 + zv 3 u 3 

而且 （58) 和 （61) 的组合将归结为 

x(u)y(u) = x 0 y 0 + (iV[ - X2 ： V3) W 十 ^>iu 2 + t^ 3 w 3 + 

( u；0 - j ： 0 y 0 )u 4 + x 2 y ^ u 5 (62) 

(当然这个等式可直接验证。） 
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剩下需要解决的问题是计算 x ( u 、 yU ) mod U 4 -1); 而这个子问题本身就很 

有趣。我们暂且允许： r(W 是三次的而不是二次的，则 工 （ u)y(u) mod 的 

系数分别为 

■To^O + 工 13^ + 工 2_> ; 2 + ^3^1 ^ + ^'1^0 + ^2^3 + - r 3 V2 ^ 


•^0^2 + + -3：2 3 ; 0 + 工 3^3 ，工 0 ： V3 + ^1^2 + 工 23M + ^'3^0 

而对应的张量为 


1 0 0 0) 


0 10 0 、 


0 1 CP 


：o 0 0 r 

0 0 0 1 


10 0 0 


0 10 0 


0 0 10 

0 0 10 


0 0 0 1 


10 0 0 


0 10 0 

.0 10 0. 


、0 0 1 0> 


.0 0 0 1. 


,1 0 0 0. 


(63) 


一 般来说，当 deg(jo) = deg (^ y ) - n~ \ ^ , x ( u) y( u ) mod (u n ~ 1) 的系数称为 （: c 0 , 

• r ! ，…， : r ，,-.[) 和 （ 3； q ， l ， ^ - i ) 的循 环卷积 。第々个系数叫是双线性形式 
S x { yj ，它对满足 i ^ j = k ( modulo /? ) 的所有 2 ■和）求和。 

应用规则 （59) 可以得到4次循环卷积。头一步是求 u 4 - l 的因子，即 （2/-1)* 
U + 1) U 2 + 1)。 我们可以把这写成为 U 2 - 1) U 2 + 1)， 然后应用规则（59)，然后 
再次使用 （59) 到模 U 2 - l ) = ( w - 1 )U + 1) 那 部分； 但更容易的方法是直接推广中 

国剩余规则 （59) 到几个互素因子的情况。例如，我们有 

■ 

x(u)y(u) mod q/y u) q 2 (u) q^iu) = (ai(u) q 2 (u) q 3 (u)(x(u) y(u) mod q\{u)) + 

a 2 (u) qxiu) q 3 ( u)(x(u) y( u) mod q 2 (u)) + 

a^(u) qi( u) q 2 (u)(x( u) y(u) mod g 3 ( u))) mod q[(u) q 2 (u) q^( u) (64) 

其中 以 ） + d2(w)g 1 (w)g 3 («) + a 3 (w)g 1 (“ ） g 2 (w) = l 。 （通过注 

意到 l /心 （w ( a ) 仍 （w ) 的部分分式展开是 a x ( u)l q x { u ) + a . 2 ( u)l q 2 ( u ) + 

a 3 U )/(? 3 ( W )， 也可以以另一种方式来理解这个等式。）由 （64) 我们得到 


2 


'(u)y( 


U 


mod ( 


u 


-1) = 



+ W 2 + W + 1)^(1)^(1) 



o 

u" + u — 


1) • 


oc( - l) ： y( - 1) 


2 


u 


2 


一 l)(x(u )y( 


u 


mod 


a 



1))) mod 


u 


4 


_ 1) 


(65) 


余下的问题是计算 


X \ u 


) y ( 


U 


mod ( u 2 + 1)， 而这正好是调 用规则 （60) 的时 


候。首先我们简化: r ( w ) 和 y(u) mod 


u 


2 



1 ) ，得到 X( u) = (xo - X 2 ) ^ (x[ - 


x 3 ) a ， Y(u) = (y 0 - y 2 ) 



(y 


i 


wh 。 然后由 （60) 可计算 x ( w ) y ( w ) = z 0 + z ^ 


Z 2 w 2 ， 进而在模 （ w 2 + 1 ) 下简化这个式子，得到 （- Z 2 ) + Z 


u 


O 


计算 


XU ) YU ) 的工作是简 单的； 我们可以以十1)来使用规则 （58〉， 得到 


^0 


x 0 y 0 


z 


x 0 y 0 - (x 0 - x L )(y 0 - ^)十 x t y 


z 


X, Y 


(我们由此以更加系统的方式重新发现等式 4.3.3-(2) 中的窍门。）综上所述，就得到 
了 4次循环卷积的下列实现 ( A ， B ， C ) : 
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这里1代表 _ 1，2代表- 2。 

n 次循环卷积的张量满足 

l i, } ,k = (67) 

在模72之下处理下标，因为当且仅当 Z •十 modulo 72) 时，^ = 1。于是如果 
(~)，（^)，（~)是循环卷积的一个实现则（~)，（6_ ; ,/)，（~)也是 ； 特别是，我们 
可以通过把 (66) 变换成为 



而实现（63)。现在所有复杂的标量见于矩阵 A 中。这在应用中是很重要的，因为 
我们通常要对许多不同的 ^ o ^ l ^2^ V 3 和固定的：^，：^，工 2 ，1 3 来计算卷积。在这 

种情况下，对于工的算术运算可以一劳永逸地完成，因此我们不必把它算在内。于 
是当事先知道 Xi , X 2 ,00^ , 工4 时， （68) 导致计算循环卷积 VUQ y VU l , VU 2 y 的下列方 

案： 


5 1 = ^0 + 力 ， s 2 ~ y\ ^ 力 ， s 3 = 5 1 s 2 y 5 4 = s \ ~ s 2 •) 

s 5 = yo ~ y2y s 6 = y3 ~ y\ ^ S 1 = s 5 ~ s 6 


m 】 



+ 12 + 工 3 ) 


^3 



m 4 








工 0 十工 1 十工 2 _ 工 3 ) • ， 


m s 



t x — m ] 十 m2 ， ti — 7^3 十饥 5, i^3 = 711 \ ~ m 2y t 4 二 rrt\ - m s 

Wq — t\ + ti 5 = ^3 + 尤 4 ， U) 2 — ti - 广 2 ， 切 5 = ^3 _ t 4 (69) 

它有 5 个乘法和 15 个加法，而循环卷积的定义含16个乘法和12个加法。我们后 
边将证明，5个乘法是必要的。 

利用 （62) 回到原来的乘法问题(54)，我们已经推导出实现 
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(70) 

这个方案比链乘法的极小次数多用一次乘法，但它比 （57) 要求少得多的参数乘法。 
当然，必须承认这个方案仍然颇为 复杂： 如果我们的目标只不过是计算两个给定的 
多项式的乘积 （A + A w + x 2 u 2 )(yo + y\u + yi ul + : y3 w 3 ) 的系数 q ，… ，: z 5 ，作 

为一个碰运气的问题，我们最好的赌注显然仍是做12次乘法和6次加法的那个方 
法——除非（比如说），诸: c 和诸^是矩阵。另外一个要求8次乘法和18次加法的 
相当吸引人的方案，岀现于习题 58( b ) 中。注意如果诸: r 是固定的而诸^是变化 
的，则 （70) 以7次乘法和17次加法进行计算。尽管这个方案本身不像它宣称的那 
样特别有用，但我们的推导已经显示了在各种各样其它情况下的一些重要技术。例 
如 , Winograd 已经利用这个方法，利用比快速傅里叶变换算法所需要的要少得多的 
乘法来计算傅里叶变换（见习题 53 )。 

让我们通过确定对应于两个多项式在模第三个多项式之下的乘法的 n x n x n 
张量的精确秩来结束这小节。 

Z 0 + 2 ^以 + ••* 十 Z n _ x U n ~ l = 


(: r 0 + + …+ —Mbo 十 ％ “ + … + y n _ x u n ~ x ) mod p(u) (71) 

这里 MzO 代表任何给定的； 2 次首一多 项式； 特别是， MzO 可以是^-1，所以我们 
研究的结果之一将是推导对应于；7次循环卷积的张量的秩。以 

p ( u ) = U n - p „ — iu n - r - p { u - p 0 (72) 

的形式来写 p w ) 是方便的，我们有 〆 三 十 w +…+ p n ~\ u n ~ [ ( modulo 

p ( u)) Q 

张量元素^是在 V — mod 中以 的 系数； 而这是矩阵 P 的 2 行々列的元 

素，其中 



^0 Pi P 2 •“ Pn-X^ 

称为 的伴随矩阵。 （在我们的讨论中下标 i , j , k 为从0到 n - 1而不是从1 
到”。）把这个张量转置一下是方便的，因为如果7说=^，则对于^ =0,1,2,-, 

77 -1,(7^) 的各层次可简单地由矩阵 


• 469 . 



4 幸算术 

I P P 2 … P n ~ l (74) 

给出。 

(74) 中矩阵的头一行分别是单位向量（1，0,0,…，0)，（0，1，0，"*，0)，（0,0, 

1，一，0)，〜，（0,0,0，〜，1)，因此，当且仅当系数％全为0时，线性组合 S = 户 
是零矩阵。而且，大多数这些线性组合实质上是非奇异矩阵，因为当且仅当 v ( u ) 

uu ( u )=0 (modulo />( w )) 时，我们有 

Ti~\ 

( zv 0 y zv x r '' V k P k = (0,0,… ，0) 

k^O 

其中 v ( u ) — vq 巧“十… + — iw ” 1 和 zv ( u ) = zvq + WiW + … + 1 。因 

此，当且仅当多项式 lU ) 是 M w ) 的某个因子的倍数时， 2=(； 是奇异矩阵。 
我们现在已做好准备来证明所需的结果。 

定理 W ( S . Winograd ，1975) 设 p ( u ) 是 n 次 首一多项式 ，它在一个给定无穷域 
上的完全分解是 

p ( u ) = P 汄 uY ' … (75) 

则在这个域上对应于双线性形式 （71) 的张量 （74) 的秩为 2 n - q 。 

证明通过以适当方式使用规则（58)，（59)和（68)，可以只用 2 n - q 个链乘法 
计算双线性形式，所以我们只须证明秩 r >2 n - q 。 上边的讨论确定了 rank ( T ( ^,) 

= w 因此由引理 T ,( T ^) 的任何 n 乂 r 的实现 （ A , B ， C ) 都有 r ank ( C )= 心我们 

的策略是通过找出具有下列两个性质的一个向量（叫，〜， … ，％ _i) ，再次使用引理 
T ： 

0向量（°^ 0 ，。 1 ，…，至多有 <7 + r - 72个非零系数。 
ii ) 矩阵 v ( P ) 二 X :: lv k P k 非奇异。 

上述事实加上引理 T 将证明 g + r - ，因为恒等式 

r n - 1 

X) a u b ji ( 2 v k c ki) = ^(p)o 

/ — l 々 = 0 

表明如何用 <? + r _ r ? 个链乘法实现秩为 n 的 wXnXl 张量 7 ；(戶）。 

为方便起见，我们可以假定 C 的头 n 列是线性无关的。设 D 是使得 DC 的头;7 
列等于单位矩阵的 n X n 矩阵。如果有 D 的顶多 g 行的线性组合（％，％，•••， 

使得 WP ) 非奇异，则我们的目标就实 现了； 这样一个向量将满足条件0和 

ii )。 

由于 D 的行是线性无关的，所以没有不可约因子九 （〃） 能整除对应于每个行 
的多项式。给定一'个向量 w =( wo , " W \ , *** , ^ w n _ : ) ，令 covered (） 是使得 ( w ) 不 
是九 “）的倍数的所有 A 的集合。由两个向量 p 和 w ， 我们可以找到一个线性组合 
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^ + au ；， 使得对于这域中的某个 a 

covered ( v + azv ) = covered ( v ) U covered ( vu ) (76) 

原因是如果 A 为或 w 覆盖但不是为两者所覆盖，则对于所有非0的 a ,； i 为 

v + au ; 所覆盖；如果 A 为 t ; 和 m 两者所覆盖但不为 r 十 aw 所覆盖，则对于所有 

^ 为 v 十 pw 所覆盖。通过试验 q + 1个不同的 a 值，至少有一个必然产生（76)。 

这样一来，我们可以系统地构造 D 的至多 g 行的线性组合，并且对 l < A < g 覆盖所 
有 A 。 ■ 


_定理 W 的最重要推论之一是 ，一 个张量的秩可以依赖于构成 （ a ， B ， C ) 的实现 
的元素所属的域。例如，考虑对应于5次循环卷积的 张量； 这等价于多项式模 p ( u ) 
= u 5 ~ l 的乘法。由习题 4.6.2 - 32知，在有理数域上， p ( w ) 的完全因子分解是 
U -1) x ( 〆 + “ 3 + “ 2 + w + 1)，所以张量的秩是10-2 = 8。另一方面，在实数上 

的完全分解，借助于数必=备（1+7^)，是(^ _1)( « 2 +如+ 1) U 2 - 多 - S +1); 于 


是，如果我们允许任意实数在 A ， B ， C 中岀现，则秩仅为7。在复数上秩为 


在 


维张量（即矩阵）中，秩可以通过计算子矩阵的行列式和测试0来确定，就不出现这 

个现象。当含有矩阵的元素的域被嵌在一个更大的域中时，一个矩阵的秩不变，但 
当域变得更大时一个张量的秩可以变小。 

在给出定理 W 的文章 [ Math . Systems Theory 10 ( 1977 )， 169〜180 ] 中, 

Winograd 证明，当 g 大于1时，在 In - q 个链乘法下 （71) 的所有实现对应于 （59) 的 


使用。此外他还证明，在 deg ( x ) + deg ( v ) +1个链乘法下计算： rUb (〃） 的系数的 
惟一方法是使用内插，或对于在这个域中分解成不同线性因子的一个多项式使用 

( 58 ) 。最后他证明了，当 q — \ 时，在2/2 _ 1 个链乘法中计算 x ( u ) y ( u ) mod p { u ) 
的惟一方式实质上是使用 （60)。 这些结果对所有多项式链都成立，而不仅仅是对 

“规范”的那些。 ^SICOMP 9 (1980)，225〜229中，他把这些结果推广到多变量多 
项式。 


在一个适当大的域中，一个任意的 mX n X 2 张量的张量秩已经由 Joseph ja > 

Ja ’ 确定， S/COMP 8 (1979)，443〜462 ; /ACM 27 ( 1980)，822〜830。也可见他在 

S/COMP 9(1980),713-728 中关于可交换双线性形式的有趣讨论。然而，计算在 

任意的有限域上一个任意的 n X n X n 张量的张量秩的问题是 NP 完全的 [ j . 
Hastad ， Journal of Algorithms 11 (1990) ， 644 〜 654]。 


关于进一步的阅 读资料在这一小节里，我们只是肤浅地接触了非常广泛的课 
题的 表面； 在这个课题中正在出现许多优美的理论。关于更加广泛的讨论见 

Borodin 和 I ^ Munro , Computational Complexity of Algebraic and Numeric Problems 
(New York : American Elsevier ，1975 ); D . Bini 和 V . Pan , Polynomial and Matix 
Computations 1 ( Boston : Birkhauser , 1994 ); p . Burgisser , M.Clausen 和 M . Amin 
Shokrollahi , Algebraic Complexity Theory ( Heidelberg : Springer , 1997) 。 
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1.[15]什么是计算一个“奇”多项式 

u{x) = U2 ri + lJ： 2n + l + U 2 n-\ 0 C ln X + **■ + U [ X 

的好办法？ 

► 2.[ M 20] 如果不像在正文中那样用步骤 HI 和 H 2 计算 + ，试讨论当使用多 项式乘 
法和加法而不用系数区域中的算术运算时如何应用霍纳规则（2)。 

3. [20] 为求两个变量的多项式之值，给出类似于霍纳规则的一个方法（这个 

多项式有 U + 1)(^ +2)/2 个系数，且“总次数”为 rO 。 计算你所用的加法和乘法的次数。 

4. [ M 20] 当我们在一个复数点 z 处对一个实系数多项式求值时，正文说明方案 （3) 比霍纳规 
则优越。 当系数和变量 z 两者 都是复数时，试比较 （3) 和霍纳 规则； 对于每个方法需要多少次（实 
的）乘法和加减法？ 

5. [ Mi 5] 计算第二阶规则 （4) 所需要的乘法和加法的次数。 


6 . [22 ] (L. de Jong 和 J. van Leeuwen) 说明怎样只通过计算的大约+ 次幂，来改进 Shaw 

- Traub 算法的步骤 S 1， …， S 4。 

l .[ M 25 ] 如何计算^，…，氏，使得对于所有整数 M 6) 有值 u ( x 0 + kh)l 

8. [ M 20] 阶乘乘方 W 定义为々！ （ f ) = xU - l ) … U -々 + l )， 说明怎样以至多77次乘法和 

k 

2 n -1 次加法，由： c 和72 + 3个常数、，…， w 0 ， l，n — 1开始，来求仏，+…+ ^,- r 1 + w 0 的值。 

9. [ M 25 KH . J . Ryser ) 证明如果(%)是一个 n ^ n 阶矩阵，则 

per(X) = E (- H E 内 

这里求和对所有独立地等于0和1的 2 W 种…， q 的选择进行。计算通过这个公式求 per ( X ) 


的值所需要的加法和乘法运算的次数。 


10 . [M21 


个 nx w 阶矩阵的积和式可计算如下••由 n 个量 x u ，: r l2 


工1„开始， 


对于1<6< 〃，假定对于 U 


蠡# ■ 


n 丨的 所有々 元子集 S 已经计算了 


n 


\k 


个量 A 


kS 


其中求和 


是对 S 的元素的所有 A ! 个排列进 行的； 然后形成所有的和式 


^(k+\)S - 2jAks\ 1 川 工 ( 々 +1” 

我们有 per ( X ) = Aw ，...，」。 这个方法要求 ^ 少次加法和乘法？需要多少个临时存储？ 

U .[ M 46 ] 有没有任何方法使用少于2” 次算术运箅，来计算一个一般的 nx n 矩阵的积和 
式？ 

12. [ M 50] 为形成两个7? X n 矩阵的乘积要求的极小乘法次数是多少？什么是最小的指数 o > 
使得对所有6>0,只要 0( rT +< ) 次乘法就够？（对小的和大的77求好的上限和下限。） 

13. [ M 23] 借助于/( 51 ，…，的值表达 FUi ，…，/，,），求出一般的离散傅里叶变换 （37) 的 

逆。[提 示： 见等式12,9-(13)。] 

► 14. [ HM 2 S ] (快速傅里叶变换） 证 明：利 用对复数的算术运算，方案 （40) 可用来计算一维离散 
傅里叶变换 
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/ ⑴二 2 F ⑴ O /' O ； = e 2 气 0 < 5 < 2" 

估计所执行的算术运算的次数。 

► 15. [ HM 28 ] 在？2 + 1 个不同的点 ，…，处函数 /( x ) 的？7次均差 /( jc 。，:^，一，:^)* 

公式 

f(jr 0 f x l , ■■- ,x }1 ) = (f(jC 0 ,JC { y ■■- ，- !) - f(jc { y ■■- ， - r„-i yX n ))Kx 0 - x n ) 

来定义，其中 n > Oo 于是， /(: c 0 ，:^，…，工 „ ) = '^k = of ( Jc k ) i ^ o ^ j ^ n , j^k (^k _ 〜）是它的 n + 1 个 
自变量的对称函数。 （ a ) 证明：对于在 min ( o：o , *•* ， A ) 和 max ( x Q ，… ，: c „) 之间的某个 6 1 ， 如果 n 阶 
导数 / U ) (: c ) 存在且连续，则 f ( x 0 , …，工”)= f ⑴ （ d ) ln '.。 [提示 ：证明 恒等式 

「1 Ct { 

/( 工 。，：^ ，…， X ”) 二 d “ dy ” d/ y / U) (x 0 (l - t x ) + 一 之 2 ) + … + 

Jo J 0 J 0 


- 1 ( — l 

当 X ,不是不同的时，这个公式也以 


7/ ) + - 0 )) 

个有用的方式定义 fix^x 


r ；)。] ( b ) 如果 



/(;), 证明在牛顿内插公式 (42) 中 affUo , 




,)o 


16. [ M 22] 如果给定牛顿内插多项式 (42) 中 a ： o^i 

容易地计算 U [ n ]( x ) = +…+ Wo 的系数？ 

17 . [ M 20 ] 证明对于 0<々< W ， 当& = 20 +姑时， 
个非常简单的表达式。[提 示： 见习题1.2,6-48。] 


y ^ rt _ 1 ，仃 0 ，仃 1 


的值，我们怎样能 


内插公式 （45) 归结为涉及二项式系数的一 


18. [ M 20] 如果把四次方案 （9) 变成 

y = (x + a 0 )jc + a { f 


u ( x ) 




((y - x + a 2 )y + « 3 ) a 4 


为借助于诸 ^ 来计算诸 a , 应以什么公式取代 （10)? 


► 19. [ M 24] 说明怎样从 wG ) 的系数 W 5 ，…，来确定 （11) 中改写的系数 

并且对具体的多项式 + 10_2： 3 - 50 1 r 2 + 13 ：c + 60 求出诸 a 。 

► 20. [22] 写出一个 MIX 程序，它按照方案 （11) 计算一个五次多 项式； 试通过对 （11) 稍作修改， 
使得这个程序尽可能地有效。使用 MIX 的浮点算术运算符 FADD 和 FMUL ， 有关它们的介绍见 4.2.1 
小节。 


21. [20] 利用正文中未加考虑的 （15) 的两个根，通过方案 （12) 找出计算多项式/ + 13/ + 
49 x 4 + 33 x 3 - 61 a : 2 — 2>1 x + 3值的两个新方法。 

22 . [ i 8 ] 怎样利用 Pan 的方法 （16) 计算 x 6 - 3 x 5 + x 4 - 2 a : 3 + x 2 ~ 3 x - 1 的值？ 

23. [ HM 30]( J . Ev e ) 设 f ( z )= a n z n ^ A -丨 〆 — 1 +…+〜是具有实系数的72次多项式，它至 
少有 n -1 个有非负实部的根。设 

发 ( 之 ）= a〆 + '_〆- 2 + …+ '眶 ! 2 ， mod 2 

h ( z ) = + a ”_ 3 /一 3 + … + 

假定 / iU ) 不恒等于0。 

a ) 证明 gU ) 至少有 n - 2 个虚根（即实部为0的根），而/ 1 (幻至少有77 -3 个虚根。[提 示: 
对于充分大的半径尺，当 z 围绕图16中所示的通路行进时，考虑通路 /( 幻围绕原点循环的次 
数 J 

b ) 证明 g ( z )^ 0 , h ( z )=0 的根的平方都是实数。 

► 24. [ M 24 ] 对于多项式 u ( x ) = (x + 7 )( x 2 + 6 x + \ 0 )( x 2 + + 5 )(x 十 1) ， 求满足定理 E 的 

条件的 c 和 q ， ft 的值。选择这些值使得/? 2 = 0。请对这个问题给出两个不同的解。 

25 . [ M 20 ] 当把定理 M 证明中的构造应用于（低效的）多项式链 
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a 



又 0 ， 


义0 — 义0，义3 




Ai + A 1 ，义 4 




义5二义0 —又0， ^6 ~ —久5， ^7 


HHH Jm 


a 7 X A 6 , A 8 




沒 2 X 入 3 ， 

A 7 x A 7 j 


A 


AI x A 4 , A jo 


a & - Xg , A 


il 


— A 


时，怎样借助…， a 8 表达 H …， 


^26, [ M2J ]( a ) 给出对应于计算 3 次多项式的霍纳规则的多项式链。 
) 使用出现于正文中的定理 A 证明中的构造，借助于 A ，/3 2 ， ft ，/9 4 和^ r ， 

( c ) 证明，当 mih 独立地取所 


表达和结果多项式 


X ) 0 



iR 


+ 0 


-iR 


有实数值时， （ b ) 中得到的结果集合省略了 （ a ) 的结果集合中的某些向量。 

27. [ M 22] 设只是这样一个集合，它包括使的所有实数 r ? + 1元 

组（〜，…， W 4。）； 证明只不会至多有”个自由度。 


图16 Eve 定理 

的证明 


28 ^ [ HM 20 ] 证明如果 / 0 (a 






，~)是整系数的多变量多项式，则对于所 


有实数 a 


1， 


，~，有一非 0 的整系数多项式 g (: r G ， …，: r ,) 使得 g ( fo{a 


， t ) ， 


，/、心1，…， 


~))= 0 。（因此有 s 个参数的任何多项式链至多有 s 个自由度。）[提示：利用关于“代数相关性” 

的定理，它们可以在 （ 比如说） B . L . van der Waerden 著的 Modern Algebra — ^书中找到 , Fred Blum 译 


(New York ： Ungar , 1949) ，第 64 节。] 

► 29.[ iW 20] 设 R li R 2 y --, R ni 都是至多有 r 个自由度的实数 n + 1 元组的集合。证明并集 

i ^ Ui ? 2 U … 11 化,，也至多有 r 个自由度。 

► 30. [ M 28 ] 证明有' 个链乘法和个参数乘法的一条多项式链至多有 2 m c 



P 



汐 0 w 个 


C 


自由度。[提 示：推 广定理 M ， 说明头一个链乘法和每个参数乘法实质上都只能引迸一个新的参 
数到结果集合中。] 

31. [ M 23] 证明有能力计算所有 n 次首一多项式的一条多项式链，至少有 Ln /2」 次乘法和至 
少有77次加减法。 

32. [ M 24] 找出长度为极小的多项式链，它能计算形如的所有多 项式； 并证 


明它的长度是极小的。 

► 33. [ M 25] 设7；>3是奇数。证明有 U /2」 + 1 个乘法步的一条多项式链不可能计算所有 n 

次多项式，除非它至少有《+2个加减法步。[提示：见习题30。] 

34. [ IV /26] 设 A 0 , A ,,*-*, A r 是一多项式链，其中所有加法和减法步都是参数步而且它至少含 

有一个参数乘法。假设这个方案有 m 次乘法和々= r - m 次加减法，而且由这条链计算的多项式 
最大次数为试证明所有可由这条链计算且其/项的系数不是 0 的多项式，都可通过另外一 
条链来计算，这条链至多有 m 个乘法和至多 A 个加法，并没有 减法； 而且新的链的最后一步应仅 

仅是参数乘法。 

► 35. [ M 25] 证明，使用3次乘法计算一般4次多项式的任何多项式链，必然至少有5次加减 
法。[提示：假定只有4次加减法，证明可用习题34;因此这个方案必然有一种特殊形式，它不可 

能表示所有的4次多项式。] 

36. [ M 27] 继续上一道题，证明仅仅利用4次乘法计算一般6次多项式的任何多项式链，必 
然至少有7次加减法。 

37. [ M 22 KT . S . Motzkin ) 证明系数在域 S 中的形如 

+ …+ U]JC + U 0 ) l ( x ” + ■[；„ — [工，’ -1 + …+ 巧工 + r 0 ) 

的“几乎所有”有理函数，均可以对 S 中适当的利用方案 

+ 1^1 (工 + + 彡 2 /(工 + …+ + a ，, + 1 V “）） 
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来求值（这连分数方案有 《 个除法和 2 n 个 加法； 所谓“几乎所有”有理函数，我们指的是除了那些 
其系数满足某个非平凡的多项式方程之外的所有有理函数）。试对于有理函数（^ 2 + 10_ 2 ： + 29)/ 
U 2 +8: r 十 19) 确定诸 a 和诸 

► 38.[ HM 32]( V . Y . Pan ,1962) 本题的目的是证明，如果不做系数的预先改写，则霍纳规则真 

正是最优的；如果给定变量 U n , Uq y X 和任意常数，则计算 U ， r Z ” +…+ UyX + Uq 需要 W 次 

乘法和77次加法。考虑如以前那样的链，只是把 、，… ，…，看做 变量； 我们可以说，例如 

为了证明霍纳规则是最好的，方便的做法是首先证明一个稍微更一般的定 

理：设 A = ( a ^) , ( Xj^n 是秩为？2十1 的 （m + l ) X (7 z 十 1) 实 矩阵； 并设 B = ( b Q ，“.， 

O 是实向量。证明计算 

m 

P(X;M 0 , …， O = 2( 屮 0 W 0 + …+ <^in u n + 6 ) 〆 

，■二 0 

的任何多项式链至少包含 n 个链乘法。 (注意，这并不仅意味着我们考虑的是某个固定的链，其中 
诸参数义被赋以依赖于 A 和 B 的值； 它还意味着链和诸 a 的值都可以依赖于给定的矩阵 A 和向 

量 B 。 不论 A ， B 和诸~的值如何选定，如果不做； z 个“链步”乘法就不可能计算 PU ;Wl ，…， 

^ n ) o ) A 的秩为 W + 1的假定意味着 m > n 。 [提示：证明从任何这样的方案我们可以导出另一个 

方案，它有较少的链乘法而且〃的值少了 1。] 

39. [ M 29]( T . S . Motzkin ,1954) 证明对于 \ < k<m 的形如 

^1 = oc(x + Oy ) + /?! , w k - w k - x ( w x + Yj^c + a k ) + S^JC + 

的方案可用来计算实数上的所有 2 m 次的首一多项式，其中以， ft 是实数，而 U k 是整数。（对 
于不同的多项式我们可能要选择不同的 a ky p k y Yk 和&。）只要可能就尝试令 $ k = Oo 

40. [ M 41] ，定理 C 中乘法次数的下限能否从 U /2」 + 1升高到 「 W 21 + 1( 参考习题 33)? 

41 • [22 ] 证明“ + b\)(c + 士）的实部和虚部都可通过做3次实数乘法和5次实数加法得到, 
其中2次加法仅含 a 和6。 

42. [36 ] ( M . Paterson 和 L . Stockmeyer ) ( a ) 证明有个链乘法的一个多项式链至多有 
m 2 + l 个自由度。 （ b ) 证明对所有 n >2 存在〃次多项式，其所有系数皆为0或1，如果我们要求 

所有参数士为整数，则它不能由有少于 UG 」 次乘法的任何多项式链来计算。 （ C ) 证明任何77次 

整系数多项式都可由一个全整数算法来计算，这个算法至多执行 2 L /7」 次乘法，如果我们不在乎 
做多少次加法的话。 

43. [22] 说明怎样用 2 ZU + 1) -2 次乘法和 l(n + 1) 次加法（没有除法或减法）计算： r ” +…+ 
: r + 1， 其中 / U ) 是在 4.6.3 小节中研究的函数。 

► 44. [ M 25] 证明，使用■的整系数多项式参数心 ，幻 ，…，可以通过士 ；2 + 

0( log ") 次乘法和小于等于次加法，计算任何首一多项式 u ( x ) = x T] ++…+ WQ 。 
[提示 ：考虑 n =2 l 的情况]。 

► 45.[ HM 22] 令（^)是 w x n x 5 张量，并令 F ， G ， H 分别为大小为 m x m ，„ x „， s x 的非 
奇异矩阵。如果对于所有的2，_；，々， 

试 i 正明张量（了讲）有和 （？〜） 相同的秩。[提 示：考 虑当以相同的方式把 F _1 ， G _1 ， 1 应用于 
( Tm ) 时，会发生什么情况。] 
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46. [M28] 证明由 （:^，工 2 ) 和 （ 3 ^ 2 ) 构成的双线性形式的所有 （&，&) 对可以用至多 3 个链 

乘法来计算。换句话说，证明每个 2 X 2 X 2 张 fi 有小于等于3的秩。 

47. [ M 25 ] 证明对所有 m , n 和 s ， 存在一个 ttz X n X 5 的张量，其秩至少是「 mnsl (m + n + 
s)~\o 反之，证明每个 m X- n X s 的张量至多有 mnsl max ( mn ， 5 ) 的秩。 

48. [M21 ] 如果 （ ^ ) 和 （‘） 分别是大小为 w X rz X 5 和 w ' X a ' X /的张量，它们的 直接和 

(^ ) ㊉ （ 〆 ,;；；!：）= ( <;./：) 是如下定义的 （m 十" 〆 ） X ( n + 〆 ） X ( $ + 5') 张 M :如果 i ^ m ， j < nXs , 

贝〜；如果 f > m ，_; > 72，々> s ，则心 = 〆 ，- w ， ; _ , 7 ， h ; 否则‘二 0 。它们的直接积 （) ® 

( t \ } k )= (‘） 是由 ^<： r ><；/)( H '> - 定义的 wm ' X ”〆 X 55 ' 张量。试推导下列上限： rank (‘） 

^ rank ( ) + rank ( t- jk ) , rank ( )^ rank ( t ljk ) - rank ( tl】 k ) 。 

► 49. [ HM 25] 按照矩阵的秩为线性无关的行的极大个数这一传统定义，证明一个 m x n x 1 
张量 （) 的秩和它作为 一 m X n 矩阵 （ ~ i ) 的秩相同。 

50 . [HM20 ] ( S . Winograd ) 设 （） 是对应于 一 m X n 矩阵乘以 一 n X 1 列向量的 X n X m 
张量，试证明 （/#) 的秩是 mn 0 

► 51. [ M 24]( S . Winograd ) 试设计2次循环卷积的一个算法，它使用2次乘法和4次加法，不计 
对: r , 的运算。类似地，试设计3次循环卷积的算法，用4次乘法和11次加法（见（69)，它在4次 

的情况下解决了类似的问题）。 

52. [ M 25]( S . Winograd ) 命其中，丄给定 ，和， 次的循环卷积的规范方案， 
其中分别用次链乘法 ，（，， p 〃） 次参数乘法及 U '，，） 次加法。说明如何使用 m'm 〃次链 
乘法， // n " + m 次参数乘法及 a V 次加法，来构造 r ? 次循环卷积的规范方案。 

53. [ HM 40]( S . Wi nO gmd ) 设 w 是单位的复数 m 次根，并考虑一维离散傅里叶变换 

/// 

f(s ) 二 y^j F(t) 0 ) st , 1 < 5 < m 

i =} 

( a ) 当772 =，是一奇素数的幂时，证明对于 0 <々<£，计算（/>- 1 ) 〆 次循环卷积的有效规范 
方案将导致计算 m 个复数的傅里叶变换的有效算法。试给出对于/> = 2 的情况的类似构造。 

( b ) 当 m = m 、" 和时，证明对于/^和仍"的傅里叶变换算法可结合起来以产生对于 
m 个元素的一个傅里叶变换算法。 

54 . [M23 ] 定理 W 针对的是一个无限域。为了使定理 W 的证明有效，一个有限域必须有多 
少个元素？ 

55. [HM22] S J ° 是任意一个矩阵时，确定张量 （74) 的秩。 

56. [ M 32]( V . Strassen ) 证明，对于1<々< 5 ，计算一组二次型 S/U ! 的任何多项式链 

必定至少使用 + 个链乘法。[提 示：证 明链乘法的极小个数是在所有张量 （/#) 上取 
的 （ b ) 的极小秩，使得对所有 z ， j ，々， Z0 + ^ = q + r ^。] 利用这个事实证明，计算对应于一个张量 

( 4 ) 的一组双线性形式 （47) 的任何多项式链，无论规范的或异常的，必定至少使用 | rank ( W ) 
个链乘法。 

57 . [M20 ] 证明快速傅里叶变换可以用来计算两个给定的； 2 次多项式乘积: r ( u )_ yU ) 的系 
数，并使用 OU [og 〃） 次复数（精确）加法和乘法运算。[提 示： 考虑系数的傅里叶变换的乘积。] 

58. [ HM 2 S ]( a ) 证明多项式乘法张 M (55) 的任何实现 （A , B ， C ) 必定有下列任何 性质： A 的 
三行的任何非零线性组合必定是至少具有四个非零元素的一个向量， S 的四行的任何非零线性 
组合必定至少有三个非零元素。 （ b ) 只使用0，+ 1 和 - 1作为元素，求 （55) 的一个实现 （ A ， B ， 
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C )， 其中 r = 8 0 试使用尽可能多的 0 。 

► 59. [ M 40 ]( H . J . Nussbaumer , 1980) 正文定义两个序列 （ i ，,, _ 丨 ） 和 （ 外 ， 3 ^ ，…， 3 ^ - 】 ） 

的循环卷积为序列 Uo ，：^ ，…， A ，其中 Zh 二 工 o 3 V : 十 ... + + 工左 + 1 _ t 十+ - r „ - 1 ^. + 10 我 

们类似地定义反循环卷积，但用 

z k = 工 0% + …+ - + + …+ ^,,-13V + l) 

当 n 是 2 的幂时，构造在整数上的循环和反循环卷积的有效算法。你的算法应当全部使用整数， 
而且它们应当至多执行 O ( ；7 log 71 ) 次乘法和至多 0 ( 77 log bg bg /7 ) 次加法或减法或偶数除以 
2的除法。[提示 ：使用 （59)，阶为 2n 的一个循环卷积可归结为阶为〃的循环和反循环卷积。] 

60 . [ M 2 7 ] ( V . Y . Pan ) (m X ?〗） 乘以 （/? x 5 ) 的矩阵乘法问题对应于一个？ 《?? x w X 的张 

童（，其中 ^(i , j ')( j . k ')( k , r ) - 1 当且仅当 V 二 i ， j ' 二]及 k ' = k 。这个张量 T ( m ， n ， 
s ) 的秩是 使得％ v ， < V / ，存在并满足 

2 工功 ❿= S ( S a ui x u ) ( S b ；kuyjk 0( S ^ki l^ki ) 

I ^ / ^ w r 1 ^ m 1 ■ ：- } ^ n i k f 

Id ! 

l ^ k^s 

的最小的 r 。 设 MU ) 是的秩。本题的目的是剖析这样一个三线性表示的对称性，并 
得到当 m = n 二 s = 2 v 时整数上的矩阵乘法的有效实现。为方便起见，我们把下标 fl ， …，〃 | 分成 
两个子集0=丨1，3 ,…， n -11 和£ = U ，4，，-，/ t 1 ，每个子集含有 v 个元素。我们用规则如果 z 6 
OJIJ i = z + 1;如果则 ？ = / - 1 来建立 O 与£之间——对应。于是对所有下标 2 ,我们有 

2 — Z o 

a ) 恒等式 

cibc + ABC ― (a + A)(b + B)(c + C ) — (a + A ) 6 C — A(b + B)c - aB (c + C ) 

意味着 

S x v } y^ki = S ( 々 + 苑 )(y 々 + yfj)(z k; + zf k ) - Y) - V ) 9 - ^ 

其中 S = £x£x£U£ ： x£x OUEx Ox£UOx_Ex£ 是至多含一个奇下标的所有三元组的集 
合， L 是对于的形如+ 的所有项 之和； 而匕和1： 3 类似地是项％(办+ 

yr ; ) z ki , x^yfj ( z ki + 9 ) 之和。显然 S 有 4 v 3 = 士?? 3 项。证明 Ei , E 2 , S 3 中的每一个都可以实现为 

3/个三线性项 之和； 而且如果把形如（ 2 , 2 , 2 : )和（ 2 , 2 7 ,0及（『，丨，0的 3 v 个三元组从 S 中删去，则我 
们可以以这样一个方式修改 ， E 3 ，使恒等式仍然有效，而无须增加任何新的三线性项。于是 


当”为偶数时， + 音 


b ) 应用 a ) 的方法证明，两个大小分别为 mx „ X 5 和 5 x 7? ,. X ^的独立矩阵的乘法问题可以用 
■ 

mns + mn + ns + s ? n 次非交换乘法来实现。 


61.[ M 26] 令（以〉是一个任意域上的张量,我们把 rank〆 定义为使得有形如 


2 a u (u)b J ,(u)c k i( u ) 二 t V)k u d + 0( 2 严） 

/二 1 

的一个实现的 r 的极小值，其中〜 U)，〜U)， 化 （幻是 在这个域上 u 的多项式，于是 ratlin 是一个 
张量的通常的秩。证明 

a) rank 川（ / 说 ）<rank 〆 / 幼）； 
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c ) 在习题48的意义下 ， rank ㊉（‘） Xrank /心>)+ rank d ( t ijk ) ; 

d ) rank d ^^{( t ijk )®{ t{ }k Xrank d ( t ljk )^ rank d - ( t ijk ); 

e ) rank d + d (i t i]k ) Xrank ， （ r ( $)) ， 其中 r = rank At ijk ) 、 rT 表示丁的 r 个副本的直 

接和 丁 ㊉ … ㊉ 丁。 

62. [ M 24 ] 用 rank ( _ ) 表示的 （) 的边界秩，是 min rf ^ 0 rankj ( t i ] k ) ，其中 rankj 在习题61中定 


义。证明张量 


1 0W0 1 

0 1 / \0 0 


在每个域上有秩3但边界秩为2。 


63.[ HM 30] 设丁 （ m ，《， s ) 是如习题60那样的矩阵乘法的张量，并设 M ( N ) 是 T ( N , N , N ) 的 


秩。 


a) 证明 T ( m 、 n ， s )® T ( M ， N , S ): T ( mM ， nN ， sS )。 

b) 证明 rank d ( T ( mN , nN , sN )) ^ rank M ( N ) T ( m , n ，s))( 见习题 61e))。 

c) 如果丁 （may) 有秩小于等于 r， 证明当 N—oo 时， M(N) = 0(iV uUw 〃 ) ）， 其中 

w(m ,n y s y r ) = 3 log r / log mm 

d) 如果 了 （m，〜6') 有边界秩小于等于 r， 证明 M ( N ) = 0( N aji>fl ' ,t ' s > r) (log N ) 2 ) o 

64.[M30](A.Schonhage) 证明 rank 2 ( 了 （3，3，3) )<21 ，所以 M ( N ) 二 0( N 2 . 78 ) 。 

► 65. [M27 ] (A. Sch6nhage) 证明 rank 2 ( 丁（饥，1，”）㊉ T(l， （川- 1)(” — 1),1)) = mn + 1 。 提示: 

考虑三线性形式，当 i Xj = S/= ；! h = 0 时， 


XI S(‘ r ,. + ^；>)(^ + + “ 2 %) — u、+ … + 工 ⑺）（: yi + …十 y n )z 

\ - 1 j - [ 

66. [ HM 33 ] 我们现在能够使用习题 65 的结果来加强习题63的渐近上限。 

a) 证明极限 oj = lim„-colog M( n ) I log n 存在。 

b) 证明 ( mns)^ 3 ^rankj T ( m ， n ，5)) 0 

c) 令/ 是张量 TUw) ㊉丁 （M，/V，S)。 证明 （mm) W3 + (MNS) W3 <rankG) 0 提示 ：考虑 Z 
同它自己的直接积。 

d) 因此16一 3 + 9‘<17，而且有比<2‘55。 

67 . ](D. Coppersmith 和 S. Winograd) 通过推广习题 65 和 66 ，我们可以得到对 a> 的甚至 
更好的上限。 

a) 在引理丁 的记号之下，如果 rank( t ；( jk )) = m , rank( t } ( ki ))= ” 和 rank( ^(y)) = :?，则说张量 
(W,) 是非退化的。证明对于 x 奶 矩阵乘法的张量 7Xm，72，s) 是非退化的。 

b) 证明非退化张量的直接和是非退化的。 

c) —个长度为 r 具有实现 (A，B，C) 的 mXnX ,. 的张量/说是可改进的，如果对于 

和 〃，它 是非退化的而且有非零元素 心 、…， d r 使得证明在这样的情况下 
Z ㊉ 丁 (1，9,1)有小于等于 r 的边界秩，其中 （?= r - m -；2。 提 示：有 gX r 的矩阵 V 和 W 使得对于 
所有有关的 f 和 _;， SA i v n b jt di ^ ^ 1 a u w ) 山 = 0和2/= , =心。 

d) 说明习题65的结果为什么是 c) 的一个特殊情况。 

e) 证明 rank( T(m , n ， s)Xr 意味着 

rank 2 ( 丁 (m ， n ， s) ㊉ T(l，r - n(m + s ^ 1) ,1) )^r + n 

f) 因此，对于所有 n >\ y oj 严格地小于 log M(?7)/log /7 0 

g) 把 c) 推广到 （A,B，C) 仅在习题 61 的较弱的意义下实现 Z 的情况。 

h) 由 d) 我们有 1 ^(7(3，1，3)@7'(1，4，1))<10;因此由习题 61d) 我们也有 rank( T(9, 1 ,9)© 
2丁(3,4,3) ㊉了 (1，16，1))<100。证明如果我们简单地删除对应于丁（1，16，1)的16+16 变量的 A 
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和 B 的行，我们得到可改进的： T (9， l ，9) ㊉ 2丁(3,4,3)的一个实现。因此事实上我们有 4( 了(9，1， 

9) ㊉ 2 丁（3,4,3 )㊉ 了（1，34，1))<100。 

i ) 推广习题 66 c )， 证明 

Y ] ( m p n ^ p ) J ^ < rank ( ® T (? n p ， n p ， s p 、) 

,=i — 

j ) 因此 oj <2. 5。 

68. [ M 45] 是否有一个方法通过少于《 - 1个乘法和2” -4 个加法来计算多项式 

D X { X } = XyX 2 + + ^n-\ x n 

i^/< j^n 

(有 ㈡ 项” 

► 69. [ HM 27]( V . Strassen ,1973) 证明一个 n 乂 n 矩阵的行列式 （31) 可以通过做0(” 5 )次乘法和 
0( ? 2 5 )次加法或减法，不做除法来求值。[提示：考虑 det (/ + Y ) ，其中 X - Io ] 

► 70. [ HM 25] 一 个矩阵 X 的特征多项式 AU ) 定义为 det ( A _ T - X )。证明，如果 X :匕 ^ 


中 X ， u，v 


和 Y 分别有 n ^ n 9 lx ( n ^ l ) An - l ) X \ 和 U - 1) X (” - 1) 的大小，我们有 


fx (^) = /y ⑴入 —工— 


UV 


uYv 


uY 2 


V 


0 


v 


A 



证明这个关系允许我们以大约次乘法，次加减法，不做除法来计算厶的系数。提 示：使 


用恒等式 


(A B \ 
VC d ) 


(1 0 
\0 D 


A - BD^ l C B \ / 


0 


I 


I i \D^C Ii 


0\ 


当 D 非奇异时，它对大小为 / X /， Z ><77 z ， m >< Z 和 mX m 的任何矩阵 A ， B ， C 和 D 成立。 

► 71. [ HM 30] 四项链和多项式链一样，只是它除了允许加法，减法和乘法之外还允许除法。证明 


如果 /(A 


) 可以通过有 m 次链乘法和 d 次除法的 




四项链计算，则对于1<走< 


/(•2： 1 ，〜， > 2：,,)和所有”个它的偏微分 3/(*^ ，…，都可通过至多有 3 m + d 次链乘法和 2 d 次 
除法的单个四项链来计算。（结果，例如，为计算一个矩阵的行列式的任何有效算法都导致计算它 


的所有余子式的有效方法，因此也导致计算逆矩阵的一个有效方法。） 

72 . [ M 48} 是否有可能在有限步之内确定在（比如说)有理数域上任何给定张量 的秩? 


73 . [ HM 25 ] ( J . Morgenstem , 1973 ) 证明： 对于离散傅里叶变换 （37) 的任何多项式链，至少有 


2 


m 


m 


lg m 


m 


次加减法，如果没有链乘法且每个参数乘法都是对于有 I % I 的一个复值 


常数进行的。提示：考虑由头々步计算的线性变换的矩咗。 

74. [ HM 33]( A . Nozaki ,1978) 多项式求值理论的大部分涉及链乘法的限，但是同非整常数的乘 

法也是必不可少的。本题的目的是建立关于常数的适当理论。如果有整数 CM ，…， 是 


…， 0 1 
这样的 Ui 


和 




+ 


是全整数的向量，我们就说实向量 


，…， U 使得 gcdU , ， 
是 Z 有关的。如果没有 


) 存在，则向量 


V 


是 z 无关的。 


证明如果 r 乂 s 矩阵 V 的诸列是 Z 无关的，则当 L / 是任何 5 X 5 单模矩阵（其行列 式为土 1 


的整数矩阵）时， VU 的诸列也是2无关的。 

b ) 令 V 是有 Z 无关列的一个 r X 5 矩阵。证明由输入 jc ! ，…， a 来计算 Vi 的元素的一个多 
项式链至少需要5次乘法，其中 1=(：^ ，…， a ) t 。 
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c ) 令V是有2 ： 无关的6•个列的 rXi 矩阵，证明从输人来计算的元素的一个多 
项链至少需要 s 次乘法，其中 = (x ^，…， x ,) F 。 

d ) 说明如何只使用一次乘法，来从: r 和 y 计算值偶 U /2 + 3 M + W 3 I 。 尽管为计箅值偶 U /2 
+ 3 SZ + 3 V 2! 需要两次乘法。 

* 4.7 幂级数的操作 

如果给定两个幂级数 

U ( z ) = L/ 0 + L/^ + u 2 z 2 + •••, v(z) = V 0 + V- 1 ^ 4 - V 2 Z 2 + … (1) 

其系数属于一个域，则我们可以形成它们的和，它们的积，以及有时它们的商，等等，以 
得到新的幂级数。多项式显然是幂级数的特殊情况，它仅有有限个项。 

当然，在一台计算机内仅仅能够表示和存储有限个项，所以提出幂级数算术在计 
算机上是否可能的问题是有意 义的； 而如果可能的话，它是怎样不同于多项式算术的? 
答案是，我们仅仅处理幂级数的头 JV 个系数，其中 N 是一个参数，原则上它可能任意 
地大;我们实质上做的不是通常的多项式算术，而是模下的多项式算术，而且这通 
常导致一种略有不同的观点。此外，像“反演”这样一些特殊运算，可以对幂级数实施 
但却不能对多项式实施，因为多项式在这些运算之下不是封闭的。 

幂级数的处理对数值分析有好多应用，但也许它最大的用途是确定渐近展开（如 
同我们在 1.2.11.3 小节中已经看到的那样），或者用来计算由某些生成函数定义的 
量。后一种应用需要精确地（而不是通过浮点算术）来计算系数。这一节的所有算法， 
除去明显的例外，可以仅用有理运算进行，所以在需要时可以使用 4.5.1 小节的一些 
技术来得出精确的结果。 

当然， WU )= U ( z ) 士 VU ) 的计算是平凡的，因为对于 n 二0，1，2，".，我们有 I 

= [^] W ( z )^ U t ,± V rl 0 利用熟知的卷积规则也容易计算 W ( z )= U ( z ) V ( z )： 

11 

= E U k V “ = U 0 V n + — 丄 十… + U n V 0 (2) 

走二 0 

当 v 0 ^0 时，通过交换 (2) 中的 L 7 和 W ， 可以得到商 WU ) 二 L 7 U )/ VU ); 我们 
得到规则 


n-1 

1= (R - S^v„_,)/V 0 = 

k^O 

( u 7l - W 0 V n - - W n ^ V v ) IV , (3) 

对于诸 w 的这一递推关系，使我们容易逐次地确定 W Q ，Wi，w 2 ，…，而在计算出 
Id 之前无须输入 K 和 K。 我们说具有这种性质的幂级数操作算法是在 线的。 通 
过一个在线的算法可确定结果的 iV 个系数 W Q ，Wi ，…，而无须预先知道 N， 所 

以在原则上有可能无限地运行这个算法并计算出整个幂 级数; 或者运行它直到满足某 
个条件为止。（“在线”的反面是“离线”。） 

如果系数 R 和％ 都是整数但不是，则递推关系 （3) 就包含了分数计算。通 
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过习题2中介绍的全整数方法可以避免这一点。 

现在我们考虑如何计算 W ( z )= VU )' 其中 a 是一个“任意”的次幂。例如，我 

们可以取 a = | 来计算 vu ) 的平方根，或者我们可以求\/(^)- 1[) 或者甚至 vur 。 

如果^是 VU ) 的头一个非0系数，则我们有 


= mi + (v m+ jv m )z^ (uv 》 2 + …） 

vur = V>_(1 ^(V m+ jv m )z + (V m+2 /V m )z 2 + -) Q (4) 

当且仅当 am 是一个非负整数时，这是一个幂级数。从 (4) 我们可以看出，计算一般乘 
方的问题可归结为 V 0 = l 的 情况; 然后问题就成为计算 

W(z) = ( 1 + V| z + V 2 z 2 + V 3 z 3 + …） a (5) 

的系数。显然，二 r = i 。 

求 (5) 的系数的明显方法是使用二项式定理，即等式12.9-(19)，或者(如果 a 是 
一个正整数)可像 4.6.3 小节中那样重复地进行平方。但是欧拉发现了得到幂级数的 

乘方的 一 '个更简单和更有效的方法 [Jntroducfio 2_n Analysin Infinitorum 1(1748) ， § 76]： 

如果 WU )= YU )' 则通过微分法我们有 

+ 2 W 2 z + 3 W 3 z 2 + … = W ' iz ) = aV ( z) a ~ l V ' ( z ) (6) 

因此 


W' {z)V{z) = aW (z) V' (z) (7) 

如果现在等置 (7) 中的系数，则我们求得 


” 71 

Tjk^ k V n - k = - k)W k V n _ k ( 8 ) 

这给了我们对所有72>1都成立的计算规& 



(( « + 1 — ?? ) V! W n _i + (2 a +2 — n ) V 2 W n _2 + …+ naV n WQ)j n (9) 

式 (9) 导出了一个简单在线算法，它使用大约 2〃 次乘法计算第 〃 个系数，因而可以逐 
次地确定…。注意特殊情况 a = -1，这时 （9) 变成 (3) 的特殊情况 U ( z ) 二 

V 。 = 1。 

当/是满足一个简单微分方程的任意函数时，一个类似的技术可用于构造 
/( V ( z )) (例如见习题4)。一个比较直截了当的“幂级数方法”通常被用于获得微分方 
程 的解; 这种技术在几乎所有微分方程的课本中都有讲述。 

级数的反演 也许最值得关注的幂级数变换，要推“级数的反演”了。这个问题是 
对 z 解方程 

z — t V 2 t 2 + V 3 / 3 + V 4 t 4 + ••- (10) 

得到幂级数 

t = z + + + W 4 z 4 + *** (11) 
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m 17用算法 l 进行幂级数反演 


的系数。 

已经知道有好多个有趣的方法来实现这样的反演。我们可以说“经典的”方法是 

以拉格朗日的著名的求逆公式 [iVfenoires Acad . Royale des Sciences et Belles -Lettres de 
Berlin 24 (1768)，251 〜 326] 为基础，它指出 

=丄 [，— Md + V 2 t + V 3 t 2 + … ）1 (12) 

71 

例如，我们有 (1-0 — f 3 z 2 + …； 因此在2=，-的反演中第5项 

\4/ \4/ \4/ 

系数 W 5 等于=)/5 = 14,这同 2.3.4. 4小节中枚举二叉树的公式相符。 

关系式 （12) 有一个简单的算法证明（见习题16)，它表明如果对 n 二1，2,3,…逐次 
计算负次幂 (1+ V 2 (+ …）1,则我们可以反演级数（10)。这一思想的直截了 

当的应用将导致一个在线反演算法，它使用近似于 N 3 /2 次乘法来求 iV 个系数，但等 
式 (9) 使得有可能只处理 (1+ Vy + + …的头 n 个系数，得到只要求大约 N 3 / 

6次乘法的一个在线算法。 

算法 L (拉格朗日幂级数反演）这个在线算法对于/2=2,3,4,…， N , 输入 （10) 中 
V ,,的值并输出 （11) 中的值。（数 N 不必事先 确定; 可以使用任何需要的终止准 

则 。) 

L 1 •[初始化]置 n —1, L / q — 1。（关系式 

(1 + V 2 t + V 3 t 2 + = L 7 0 + LV + …+ U n ^ t n - 1 + 0( t n ) (13) 

将在整个算法的过程中保持成立。） 

L 2 .[输入72加1。如果 n > N , 此算法 终止; 否则输入下个系数％。 

L 3. [除]对于6 = 1,2, …， n -2( 按此顺序），置 U k — U k - U k . x V 2 - U x V k 

- U 0 V k + l ;然后置 U n - { ^ — 2 L 7„— 2 V 2 - 3 L 7„- 3 V 3 -… - (n - 1) ^ - 

nL 7 0 V „。 （由此我们已经以来除 L / U ); 参见 (3) 和 (9)。） 

L 4 •[输出 W „] 输出 R - i / n (它就是 W „) 并返回 L 2。 ■ 

当应用于例子 z = t _ t 1 时，算法 L 计算 
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n 



V 


n 




U Q u , u 2 u 3 

1 



U 4 w 

1 



习题 8 表明，对算法 L 稍加修改后，只须稍加努力就可解决更为一般的问题。 

我们考虑解关于/的方程 


U { z + U 2 z 2 + U 3 z 3 十 二 z + V 2 t 2 + V 3 t 3 + ••- (14) 


得到幂级数 

，二 W 1 z + Wiz 2 + W 32： 3 十 W 42： 4 + … (15) 

的系数。方程 (10) 是 LTeLL/f L 7 3 = 〜=0 的特殊情况。如果 LA ^ O , 我们可以假 
定1/ 1 二1，如果以（17 1 幻代替^ 的话; 但我们将考虑一般方程（14)，因为 R 可能等于 
0 o 


算法 T (一 般幂级数的反演） 这个在线算法对于 n = l ，2,3, …， N 输入 （14) 中 
R 和的值，并输出 （15) 中的值。在这些计算中，使用一个辅助矩阵 T mn A < 

T 1. [初始化]置设头两个输入（即 A 和％)分别存于和 W 中（我们 


必定有％ = 1)。 

T 2 •[输出 W ，,] 输出丁 u 的值(它是 W,)o 

T 3 .[输入 L /„， K ] n 增加1。如果 n > N ， 算法 终止; 否则把其次的两个输人值 

(即 R 和存入了 171 和 V ,中。 


T 4 •[乘 ] 置 

T mn ^~- T n T m - Un - x + 了 2 + …+ T Un - m + l T m - Um - l 

且对于2<讲<72,置丁 — — V . m T mn0 (在这步之后，对于我 


们有 

t m 二 T mm z m + T w ， w + 1 ^ +1 + …十 T m 〆 十 O(z^) (16) 

对于 m >2 用归纳法，容易验证（16)，而且当 m 二1时，我们由 （14) 和 （16) 有 

K = v 2 t 27J + …十义了⑽。）返回 T 2 0 I 


等式 (16) 说明了这个算法的机制，它是由 Henry C Th a cher ， Jn 给出的 [CACM 9 
(1966)，10〜11]。运行时间实质上和算法 L 一样但却需要颇多的存储空间。习题9 
讨论了这个算法的一个例子。 

幂级数反演的另一个方法由 R . P . Brent 和 H . T . Kung (孔祥重）提出 [JACM 25 
(1978),581 〜595]，它所依据的事 实是: 在实数上用来求方程的根的标准迭代过程，也 
可用于幂级数方程。特别是，给定在接近£处有良好特性的函数 / U )， 我们即可考虑 
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近似地计算使得 fit ) =0 的实数 （ 的牛顿方法 :如果 JT 是〖的一个好的近似，则 
二 X - fU)lf U ) 将甚至更好，因为如果写 工二 t + <，我们就有 f ( x )= 

+ 0( f " ) ,/"( j ：) = / ( t ) + 0((); 因此 ^( x ) = t + e ~~ (0+(/" (0 + 0( e 2 ))! (f ( t ) + 
OG )) = r + OG 2 )。 对于幂级数应用这一思想，令 /( o ；)= v ( x ) - LTU )， 其中[/和 V 
都是方程 （14) 中的幂级数。我们希望求2的幂级数 r 使得 f ( t )=0 o 令： + 

…+ — 1 = Z + 0(?) 是 Z 的 n 阶 近似; 则《(: r ) = : -/( x )//(： T ) 将是 2 n 阶近 

似，因为对于这个/和 Z ， 牛顿方法的假定成立。 

换句话说，我们可以使用下述 过程： 


算法 N (用牛顿方法求一般幂级数的反演）这一“半在线”算法对于2*<72<2^ + 1 
输入 （14) 中％ 和％的值，然后对于/<”<24 + 1 输出 （15) 中 W ,, 的值。由此对于 k 
= 0，1，2,…， iC , 它 一次产 生成批的答案，每批/个。 

N 1 •[初始化]置 iV — 1(我们将有 N = 2 k ) 0 输入头两个系数 R 和(其中％ 

= 1) ，并置研产 L / i0 

N 2 •[输出]对 JV <； z <2 N 输出 W „。 

N 3 •[输入]置 N —2 N 。 如果 iV >2 K ， 则算法 终止； 否则对于 N < n <2 N 输入 
值％和％。 

N 4 •[牛顿步]在幂级数 

+ …+ U2N—iZ 2N - 1 - V(W\2 ： + …+ W N _ l z N ~ l ) = 

R q z n + &，+】+ …+ + OU 2N ) 

铲 （ + …+ = Qo + Qf + …+ Q N — + 0(/) 

中（其中 V ( z ) = ^ + IV 2 十…， ^(2) = 1 + 21/22 + …），使用幂级数复合算 
法(见习题11)，计算系数 Q ; 和 R J (0^ j < N ) o 然后把 W N ，…， W 2 N _ i 置入 
下列幂级数的系 数中： 


Rq + 及1之 + …+ 1 

Qo 十 十…+ Q\i - [ z N ~ 1 

并返回 N 2。 | 


% + …十 Wn，— 1 + OU N ) 


这个算法为得到多至 N = 2 K f 系数所需运行时间是 T ( iV )， 其中 

T (2 N ) = T ( N ) + (做 N 4 步的时间）+ 0( N ) (17) 

用于复合幂级数的简捷算法和 N 4 步中的除法将花费阶为 N 3 的步骤数，所以算法 N 
要比算法 T 运行得慢些。然而， Brent 和 Kumg 已经找到一个方法，用 0( N log N ) 312 次 

算术运算来进行所要求的幂级数的复合，习题6给出一个甚至更快的进行除法的方 
法； 因此 (17) 表明，当 JV — ⑺时幂级数反演可以只须做 0 (iV log N ) 3/2 次运算来实现。 

(另一方面，比例性常数要求在算法 L 和 T 输给这种“高速”的方法之前 JV 必须很大。） 

历史 记录: J . N.Bramhall 和 M . A.Chapple 在 CACM 4 (1961) ，317 〜 318,503中发 

表了头一个进行幂级数反演的 0( N 3 ) 方法，它是一个离线算法，与习题16中的方法 
基本相同，它的运行时间与算法 L 和 T 几乎相同。 
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如果要研究一个迭代过程 


X 


定的函数/同它本身的；2重组合，即 


X 


?) 


/(/( 


f 〈工 n- 
/( 工 0) 


) 的特性，首先要研究一个给 




)) 


我们定义 


X 


和/ { 


X 


/( 广 


-13 


2))，使得对所有整数 771， nX ) ， 


/ 


m + ;z 


X ) 二 




X 


)) 


(18) 


在许多场合它也使得当〃是负整数时，记号/ 


X )有意义， g |]， 如果/和 /_”] 是 


逆函数，则 


X 


=/”](/ 


n ) 


(: T )) ; 如果逆函数是惟一的，则 （18) 对所有整数 m 和 


n 


成 


o 


幂级数的反演实质上是寻找逆幂级数/ 


■ ■、一 
AL 


质上指出2： 


—1] 


: r ) 的 运算； 例如，方程 （10) 和 （11) 实 




V ( W ( z )) 和 Z 




W ( V ⑴），所以 W 


V 


[― 1 ] 


假设给定两个幂级数 v ( z ) 




V 2 z 2 + 


■ _ € 


和 W(z) 









1 • « 


使得 w = 


V 


[一 1] 


设 w 是任何非零的常数，并考虑函数 


u ( 


2^ 


容易看出 U(U(z)) 


wu 2 vu ))， 而且 


u 


u ] 


z 


W(uV(z)) 

一般地对所有整数 

W(u n V(z)) 


(19) 


n , 


( 20 ) 


因此对于77次迭代量 [7 U ] ，我们有一个简单的表达式，对所有72,它可以用大约同样 


的工作量来计算。此外，我们甚至可以用 （20) 对非整数的 n 值定义 


;例如“半迭 


代量” 1/ 1/21 是使得 U [ll2] ( U [il2] (z)) 




U(z)^} 




个函数（通过用和作为 （20) 


中 w 1/2 的值，可以得到两个这样的函数[/ 1/2] )。 

从7和 w 开始，然后定义 L ；， 我们即得到了 （20) 中的简单式子。但是在实践中， 
一般要走另一条路 :从某 个给定的函数开始，我们要找 V 和^使得 （19) 成立，即使 


得 


V(U(z)) 




U 


V(z) 


( 21 ) 


这样 


个函数 V 叫做 [ J 的 Schroder 函数， 因为它是由 Ernst Schroder 在 Math 


Annalen 3 (1871) ，2%〜322中给岀的。我们现在来考察对一个给定的幂级数 U(z) 


U 


+ 


^ % ^ 


求 Schroder 函数 




z + Vjz 2 + 


的问题。显然，如果要使 (21) 


成立则 u = U 


以 


U 


L /, 展开 (21) 并等置2的系数导致 


等式序列，这些等式从下列式子 开始: 


V \ V 4 


U\V 3 ^2V 

十 3U 2 V 3 +2U } U 3 V 2 ^ 
0 时没有解（除非平凡地 


等等。显然，当 L / i =0 时没有解（除非平凡地[； 2 = 
非 R 是 一个单 位根。我们还可能预料到，当卬 


u\ Vi 

2U x U 2 V 2 

7 2 + Ul V 2 

u 2 = u 2 = 



L / 2 二 U { v 2 




"3 

U 3 


v 3 

V 4 


「 3 = … =0); 否则就有惟一解，除 
1时有某种趣事出现，因为等式 


(20) 告诉我们，如果在这种情况下 Schroder 函数存在，则 U 


■ 

n 

wm 






Z 


眼下，我们假 


定 R 非零而且不是单位根，则 Schroder 函数确实存在，因而下一个问题是怎样计算它 
而又不用做太多工作。 

R . P . Brent 和 J . F . Tmiib 已经提出了下列过程。方程 (21) 导致了一个类似的但形 
式更为复杂的子问题，所以我们给自己提出一个更为一般的任务，而它的子任务有同 
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样的 形式： 我们现在来找 v(z)= V 0 + 十…十 八 - p” — 1 使得 

V(U(z)) = W(z)V(z) + S(z) + 0(z n ) (22) 

给定 L/U)，WU)，SU) 和 n， 其中 n 是 2 的幂，且 17(0) 二0。如果 72=1， 我们简单地 
令 V 0 -S(0)/(1- W(0))， 而如果 S (0)=0 和 W(0) = 1， 则 V 0 = lo 而且有可能从 n 

进行到 2n: 首先我们求 i?(z) 使得 

V(U(z)) = W(z)V(z) + S(z) - z n R(z) + Oiz 2n ) (23) 

然后计算 

W(z) = W(z)(zlU(z)) n + 0(2 n ).S(z) = R(z)(zlU(z)) n + 0(z n ) (24) 

并求 V (^)= V 7J + K + 1 z + … + — 使得 

V(U(z)) - W(z)V(z) + S(z) + 0(z n ) (25) 

由此得出，如同所希望的那样， U) = V(z) + U) 满足 

(U(z)) = W(z)V # (z) + S(z) + 0(z 2n ) 

这个过程的运行时间 TU) 满足 

T(2n) = 2T(n) + C(n) (26) 

其中 C (幻是计算尺 U)，WU) 和 SU) 的时间。函数 C(n) 由计算 V(u“）） 模夕 
的时间所支配，而且 C(〃） 大概比72 1 〜的阶增长 更快； 因此 (26) 的解的 TU) 阶将为 

C(n)。 例如，如果 C (”） 二 m 3 , 我们有丁 U )〜| ct 7 3 ; 或如果用“快速”组合，则 

C(”） 是 0( n log n) 3/2 , 我们有 T(n) = 0(n log n) 3/2 。 

当 W(0) = 1 和 S(0) 关 0 时，这一过程失败，所以我们需要研究什么时候会发生这 
一情况。对〃用归纳法容易证明，用 Brent-Traub 方法得到 （22) 的解必需考虑精确的 
n 个子问题。其中右边的 VU ) 的系数按某种顺序分别取值 W(z)(zlU(z)) J + 
0(/)，其中因此如果 W (0)= K 且 K 不是单位根，则仅当;=1时才有 

W(0) = 1;在这种情况下，仅当对于 n =2式 (22) 没有解时，这一过程才失败。 

因此每当 [ A 非零和不是单位根时，通过对于 n=2,4,8，16, …和 WU)= R 及 

S(z) = 0解 (22) ，可以求出 L/ 的 Schr5der 函数。 

如果（1^ = 1，则除非 LK z) = ^，否则没有 Schr5der 函数。但 Brent 和 Traub 已经找 

到了计算的一个快速 方法，甚至当 [^ = 1 时也适用，它利用函数 VU) 使得 

V(U(z)) - U / (z)V(z) (27) 

成立。如果对于同一个V，两个函数 L/(z) 和 C /“) 都满足(27)，容易验证它们的复合 
L7(C/“）） 也满足 (27); 因此 UU) 的所有迭代都是 (27) 的解。假设 U(z) = z+ 

十 L4 +1 d +1 +…，其中々>2和 U ^ y ^ Oo 于是可以证明，有惟一'的满足 （27) 的形如 

V(^) = ^ + V A + 1 ^ + 1 + % + 2 / + 2 +…的幂级数。反之，如果给定这样的一个函数 

VU)， 而且如果给定々>2和 R， 则有惟一的满足 （27) 的形如 U(z) = U k ^ + 

K + + i + …的幂级数。所求的迭代 U u] (z) 是满足 

V(P(z)) = P / (z)V(z) (28) 

的惟一幂级数 PU)， 使得 P (幻 = z + + …。通过适当的算法可以求岀 VU) 和 
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PU) 两者(见习题14)。 

如果 A 是々次单位根，但不等于1，则同样的方法可应用于函数 U [ k ] ( z )^ 

Z 十…，而且通过做 ZU) 次复合操作可由 L/U) 求得 L M: U) (参考 4.6.3 小节）。我 
们也可以处理 R =0的情况 ：如果 U ( z ) 二 U k z k + + 丨乂 + L 十…，其中々>2且 U k ^ 

0,则先求方程 V ( U ( z ))^ U k V ( z ) k 的一 个解； 于是 

u [ n ] ( z ) - V c_l] (Lr^ u， ' _l)/u ' 1)] V(z)^) (29) 

最后，如果 U ( z )= U 0 十 L/p 十…，其中 Uo 乒0,设 a 是使得 u ( a ) = a 的一个“固定 

点”，令 

U ( z ) - U(a + z ) ~ a = zU ' ia ) + 之 2 LTU)/2! + … (30) 

则 U ^- n ^'( z ) == C/ 卜 3 (之~ a) + a。 在 Brent 和 Traub 的文章中可以找到进一步的细节 

[SICOMP 9 (1980),54 〜66]。 （27) 的 V 函数以前已被 M. Kuczma 考虑过， Foncfibnai 

Equations in a Single Variable (Warsaw：PWNHPolish Scientific, 1968) ，引理 9. 4,也曾由 E, 

Jabot insky 在更早些年暗示过(见习题23)。 


代数函数 满足形如 

A〆 之） WU) 71 + …+ A l ( z ) W ( z ) + A 0 ( z ) = 0 (31) 


的一般方程(其中每个 A.U) 都是一个多项式）的每个幂级数 WU) 的系数，都可以用 
H.T.Kimg 和 J.F.Tmub 的方法有效地加以计算，见 /ACM 25 (1978) ，245〜260。也见 


D. V. Chudnovsky 和 G. V. Chudnovsky J . Complexity 2 (1986) , 271 

25 o 


〜294;3(1987),1〜 


习题 

1 . [ M 10] 正文说明当 V Q #0 时怎样以 V (幻来除 L / U ); 当 V Q = 0 时除法又应该怎样进行？ 

2. [20] 如果 L / U ) 和 VU ) 的系数是整数且关0,求对于整数 Vg +1 W „ 的一个递推关系，其 
中由 （3) 定义。你将如何使用这个结果于幂级数除法？ 

3. [ M ]5] 当 a = 0时，公式 (9) 给出正确的结果吗？当 a = l 呢？ 

► 4.[ HM 23] 证明当 V Q = 0 时对 （9) 的简单修改可用来计算 e vu ) ，而当 V 。= 1时可用来计箅 

in V (^) 0 

5. [ M 00] 当一个幂级数被反演两次时，即，如果算法 L 或 T 的输出再次被反演时，将发生什么? 

► 6.[ M 2]]( H . T . Kung ) 当 VX 0) 关0时，通过求出方程 / U )=0( 其中 / U ) = :r — 1 _ VU )) 的幂 
级数根，把牛顿方法应用到 WU ) = l / V ( z ) 的计算中。 

l .[ M 23 ] 使用拉格朗日的求逆公式 （12) 求出在 z = t _ t m 的反演中系数 W ，， 的一个简单表达 

式。 

► 8.[M25 ] 如果 W(z)^ W y z^r W# 2 + W 3 z 3 + …= Gj + Gy 2 + Gy 3 + …= GO )， 其中之 = 
VV + V 2 t 2 + V 3 P + …且 V ^ Oo 拉格朗日证明 

+ V 2 t + V 3 z 2 + … + 广 
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(等式 （12) 是 V \ = 1， G 2 = G 3 = …=0的特殊情况。)试推广算法 L 使得它得到在这个更一般情 
况下的系数 ，…， 而不相当大地增加它的运行时间。 

9 .[ 11 ] 当算法 T 确定在 H 的反演中的头五个系数时，试求出由算法 T 计算出的的 
值。 

10-[ M 20] 给定7二^ +屮/ + 1 +〜分 + 2 +…， a 关0,说明怎样计算展开式工= 3；‘+ /) 23 ^ + 
b 3 y 3la +…中的系数。 

► ll-[M25] (幂级数的复合)设 

U ( z ) = U 0 + U x z + Rz 2 十…且 V ( z ) = Vj z + y 2 z 2 + \/ 3 z 3 十…，试设计一个算法，以计算 U 
( VU )) 的头 N 个系数。 

12. [ M 20] 找出多项式除法和幂级数除法之间的 联系： 给定在一个域上次数分别为 m 和 rz 的 
多项式 “ U ) 和 iU )， 说明怎样只利用对幂级数的运算来求多项式 9 U )， rU )， 使得 u ( x )^ qU )' 

v ( x ) + 厂 （工） 且 deg ( r ) < ； 2 。 

13. [ M 27] (有理函数近似）有时希望求这样的多项式，它们的商和某个给定的幂级数有相同 

的初始项。例如，如果 WU ) = 1 十 z + 3 z 2 + 7 z 3 +…，实质上有四种不同方法把 W “） 表达为 
zd\{z)I w 2 ( z) + 0( z 4 )， 其中 和 W2 ( 2 : ) 是有 deg ( ) + deg ( rt > 2 )<4 的多项式 

(1 + s ： + 3z 2 + 7^ 3 )/1 — l + z + 3z 2 + 1 2 ? + Oz 4 + … 

(3 — 4z + 2z 2 )/(3 — 1 z) = 1 + 2 ； + 3 之 2 + 7 之 3 + + 

( 1 — 2 ： )/(1 — 2z — z 1 ) — 1 + 2 + 3z 2 + 7 z 3 + 17 之 4 + … 

1/(1 - z ~2z 2 - 2z 3 ) = I + z + 3z 2 7z 2 + 15^ 4 + •■- 
这类有理函数普通称为 Pade 近似，因为它们为 H . E . Pade 广泛地研究 [Annales Scient . de I Ecole 

Normale Supevieure (3) 9 (1892)， S 1 〜 S 93 ; (3) 16 (1899) ,395 〜 426] 。 

证明使 deg ( Wi ) + deg (^ 2 )< .V 的所有 PadS 近似 W ( z ) = zv . iz )/ zv 2 ( z ) + 0(，） 都可以通 
过把扩充的欧几里得算法应用于多项式，和 W 0 + + …+ 而 得到； 并设计在每个 

W , 都是整数的情况下的一个全整数箅法。[提 示： 见习题 4.6. 1-26。] 

► 14.[ HM 30] 当 U(z)-z~\- R / + …时，利用 （27) 和 （28) 补足用于计算 （7 [”] U ) 的 Brent 和 
Traub 方法的细节。 

15. [ HM 20] 对于什么样的函数 L 7 U )， VU ) 有 （27) 中的简单形式关于 L / U ) 的迭代你 
推导出什么？ 

16. [ H / VT 21] 设 WU ) = G (/) 如同在习题8那样，求系数…的“明显”方法进行 
如 下：置 1 和 &(，）— G ( z )， 然后通过重复地置 W n -[ t ] R > I ( t ) IV ly R } , + l ( t )^ R n ( t ) iV ( t ) 

-W" ， 72—77 + 1 保持关式 W tl V( t) + 十 ！ V( r ) 2 + … = Z ) 。 

通过证明，对所有和 k >\, 

yj 打十 1 

来证明习题8的拉格朗日公式。 

► 17.[ M 20] 给定幂级数 VU ) 二 V ^+ V 2 z 2 + +…，我们把 V 的幂矩阵定义为系数~ 

= V { z) k 的无穷数组 ；V 的第 r ? 个似次幂 （ poweroid ) 定义为 (x ) = v n Q + v n[ x + ■■- + 

证明诸似次幂满足一般的卷积律 

V 7 ,(x + _ y ) = S “: v ) 

k W } 
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(例如当 V ( z ) = 2： 时我们有 = / ，而且这是二项式定理。当 VU ) 二 ln ( l/(i - : r )) 时，由 
等式 12. 9-(26)，我们有 I ；,, = [ ;因此似次幂 V ， ; U ) 是/，而且恒等式是习题 1.2.6-33 中证 


明的结果。当 VU ) = f - 1时我们有 V 9 l ( x )=^ k \ n L \^ 而且这个公式等价于 

k 



这是以前我们未曾见过的一个恒等式。在组合数学和算法分析中出现的系数的若干其它的三角 
数组也被证实是幂级数的幂矩阵。） 

IS . [ HM 22 ] 继续习题17,证明似次幂也满足 


xV n {x + y )- 


{x + 


v ) S 

k 





[提示 ：考虑 ， u ) 的导数。] 

19. [ M 25] 继续习题17,借助于头一列的数= n ! V ， ; 来表达所有数 tv ， 并求出所有 
列都可由序列 tM ， W ， …加以计算出来的简单递推关系。特别证明，如果 所有％ 是整数，则所有 

都是整数。 

20 . [ HM 20 ] 继续习题17,假设我们有 WU )= 17( VU )) 和 L 7 0 = 0 o 证明 W 的幂矩阵是 V 


和 L 7 的幂矩阵的乘积：= 2 fl ) nj U jk D 

Y 2 \.[ HM 27 ] 继续上题，假设关0并设 W ( z )- - V 卜 1] (- z )。 本题的目的是证明， V 和 
W 的幂矩阵是彼此“对偶 ”的； 例如，当 V ( z )- ln ( l /( l - z )) 时，我们有 V [ _ 1] ( z ) = l - e —-' 


W ( z ) = e 2 -1 ，而对应的幂矩阵是著名的斯特林三角- 


^nk — 



0 


a ) 证明对于斯特林数的逆公式 1.2.6-(47) — 般都 成立： 

^jV nk U) kn ，{- 1 广々 = ( - 丄 ）“= 谷 ㈣ 

k k 

b ) 关系式 W [ y ]( vu )/ z；r j 表明，对于固定的 k,m 是次数小于等 

于 2 A 的; 2 的多项式。因此我们可以定义，如同在 1.2.6 小节我们对于斯特林数所做的那样，当々 
是一个非负整数时，对于任意的 a ， 

二 a k -[z k ](V(z)lzY~ k 

证明1(-川-， 0 =叫“这推广了等式1.2.6-(58))。 

► 22.[ HM 27] 给定 U(z)= U 0 + U { z+ U 2 z 2 + …且 L / 0 #0, 第 a 个导出 的函数 L； ut () 是由 

等式 


V(z) = U(zV(z) a ) 

隐含定义的幂级数 V ( z ) 0 

a ) 证明 U lol (z)= L / U ) 和 U Ul '^ { (z)-U la + ^(z)o 

b ) 设 BU ) 是简单的二项式序列1 + 2 。以前我们在哪里见过 B i 2 i ( z )? 


c ) 证明 [/] ] U ( z ) T+ "\ 提示：如果 = z / l / U )% 则我们有 

x + na 

U u '( z ) = ( W [ - {] ( z ) lzy l \ 

d ) 因此任何似次幂 V „( X ) 不仅满足习题17和18的恒等式，而且满足 

(: c + y)^ u ( x + y + na ) _ ^ ( 71 十 々 a ) >' V n - a . (y + ( n — k ) a ) 

x + I- na \ k I .T + ka y + (n — k ) a 
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V„(x + y ) x w ~ Vk (^ + ka ) v n - k(y - 

y-na 二 今“一 y - ka 

[特殊情况包括阿贝尔二项式定理，即等式 1.2.6-(16 ) ; Rothe 恒等式 1.2.6-(26) 与 1.2.6-(30); 
Torelli 和，习题 1.2.6-34。] 

23. [ HM 35]( E . Jabotinsky ) 以同样的脉络继续进行，假设17=(〜）是 U ( z ) = z + L 7 2 2： 2 + … 

的幂矩阵，令 〜= n 

a ) 说明如何来计算一个矩阵 In L ； 使得 L / UI U ) 的幂矩阵是 expU In U ) = I + a\n U+(a In 
L 0 2 /2! + …。 

b ) 设 Q 是 In L 7 的 77 行 6 列的元素，并设 

2 3 4 

In = l n 、， LU ) = Z 2 f [ + ’3 fy + 心 fy + … 


证明对于] ' U ' +卜》。 [提示：以](幻=之+丄⑴ + og 2 )。: 

\ k - I / 


C) 把 L / U ] ( z ) 当做 a 和 Z 两者的函数，证明 

^- U [ a ] ( z ) = L ( z ) ^~ U [ a ] ( z ) = L ( U [ a ] ( z )) 
a a ^ z 

(因此 LU ) = (/"々！） V ( 2 )， 其中 VU ) 是 (27) 和 （28) 中的函数。) 
d ) 证明如果~关0 ,则数 k 可从递推式 


计算出来。 



当《 2 = 0时，你将怎样使用这个递推式? 


n 

〉 J ^ k^nk 

k 二 2 


e ) 证明恒等式 



7t - \ 


S n [ 

m ! 


S 

k +■" + 厶 =// 十 m — 1 
1 in 


打 o n v 

ky \ k 2 \ 




m 


其中〜 =1+ 々 ！ + … ~ _ j 0 

24. [ HM 25 ] 给定幂级数 U ( z ) - U[-z + (^一十…，其中 K 不是单位根，令 ^ — ( u ^)%. 


C / U ) 的幂矩阵。 

a ) 说明怎样计算一个矩阵 In L ；， 使得 U M U ) 的幂矩阵是 exp (a In U ) = I + a \n U + 

(a In L 7) 2 /2! + …。 

b ) 证明如果 WU ) 不恒等于零，而且如果 U ( W ( z ))= W ( 17( z ))， 则对于某个复数 a y W 

( z )= U [ a ] ( z ) 0 

25. [ M 24 ] 如果 U ( z ) = z + U k z k + L ； 出 2 ^ + 1 + …和 V ( z )^ z + V , z l + + ! W + 1 + … ，其中 

k ^2 , /^2, L /^^0, 且 U ( V ( z )) = V ( U ( z )) o 证明，我们必定有 k - L 而且对于 a = V ^/ 

U k , V ( z )^ U [ o ] ( z ) 0 

26. [ M 22] 证明如果 L / U ) 二 LT 0 + U { z + U 2 z 2 + …和 V ( z ) = V l2 ：+ V 2 z 2 + …是所有系数 
为 0 或 1 的幂级数，对于任何6>0,我们可以在 0( iV 1 + ( ) 步内得到 U ( V ( z )) mod 2 的前 N 个系 

数。 

27 . [ M 22 ] (D . Zeilberger ) 给定 q , m 和 V ( z ) = l + Vj z + ^ 2 ^： 2 + …的系数，求用于计算 

w ( z )= V ( z ) V ( q 2：) …的系数的类似于 （9) 的递推式，假定 q 不是一个单位根。 

► 28. [ HM 26] 一个 Dirichlet 级数是形如 V { z ) = VjV + V 2 j 2 z + V 3 /3 Z +…的和；两个这样的 
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级数的乘积 1/( 2 ：) V ( 2 ：) 是 Dirichlet 级数 W (^)， 其中 

I = ^ u d v >lld 

J \ n 

通常的幂级数是 Dirichlet 级数的特殊情况，因为当^ = 2〃时我们有 V 0 + V l5 ： + V 2 z 2 + V 3 z 3 + 
… =+ \^/2> + Vjr + V 3 /8_'_+ …。事实上， Dirichlet 级数必等价于任意多个变量的幂级数 
V ( 2 ；!，2：2，…），其中 Z k = p k ~ " f p k 是第々个素数。 

假定给出一个 Dinchlet 级数 V ( z )， 而且我们要来计算： （ a ) 当 V ! = 1时 WU ) = V ( 2 ) a ； 
( b ) 当\/\二0时 WU ) 二 expV ( z ); ( c ) 当 丨=1 时 WU ) = lnVU )。 试求推广 （9) 和习题4的 
公式的递推关系。[提 示：令 rU ) 是^的素因子，包括倍数的全部个数，并令 = 
y in t { n ) Vjn z o 证明3类似于 导数； 例如和則 = e v (切⑺。] 

It seems impossible that any thing 
should really alter the series of things ， 
without the same power which first produced them. 

任何事情似乎都不可能 
真正地改变事物的序列， 
如果没有最初产生出这些事物的相同的力量的话。 

- EDWARD STILLINGFLEET, Origines Sacr 类， 2 : 3 : 2(1662) 
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This branch of mathematics is the only one , I believe , 
in which good writers frequently get results entirely erroneous . 

… It may be doubted if there is a single 
ex terxsive treatise on probabilities in existence 
which does not con tain solutions absolutely indefensible . 

我相信，数学的这个分支是惟 一 这样的分支， 
在这个分支中，就连好的作者也经常得到完全错误的结果。 

…… 是否存在关于概率的一篇详尽的论文, 
它不包含绝对站不住脚的解，可能是令人怀疑的。 

C . S . Peirce , in Popular Science Monthly (1878) 


关于习题的说明 

1.对于一个有数学素养的读者说来，这是一个一般难度的问题 

.(由 Roger Frye 于1987年在一台 Connection Machine 上经过大约110小时的 



计算之后给出的解。）95800 4 + 217519 4 + 414560 4 = 422481 4 。 

4.( 本书初稿的一位读者报告说，他已经发现了一个真正值得注意的证明，但遗 
憾的是他并没有把这一证明告诉我。） 


3 1 "p 

' l . a ) 这通常不会成功，因为电话用户总是尽可能选择尾数为零的电话号码。 
在某些地方，电话号码也许是随机地指定的。但是在任何情况下，你都不会从同一 
页上得到若干相继的随机数，因为常有同一个电话号码在一行中多次出现的情形。 

b ) 但是你使用的是左面的页还是右面的页？比如说，用左页号，除以2,并取单 
个数字，总的页数应当是20的 倍数； 即使如此，这个方法仍会有某些偏倚。 

c ) 面上的标志将使骰子有某些偏倚，但是对于实际应用来说，这个方法十分令 
人满意（而且，作者在准备这一套书中的好些例子时已经用了它）。关于这些殷子的 
进一步的讨论见 Matii . Comp . 15 (1961) ，94 〜 95。 

d ) (这是有意为引起惊奇而拋出的难题。）这个数不是很均匀随机的。如果每 
分钟放射的平均数为 m ， 则计数器记下 A 的概率是（泊松分布 ）； 所以选 
择数字0的概率是 2^ om 1 Q _ V ( l ( U )!， 等等。所得数字是偶数的概率是 ei 

cosh m = i + ，而这绝不等于备（尽管当 m 非常大时，误差小到可以忽略）。 
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然而，如果对于所有, rrij 严格地小于，则取10个输入 （ ，…，而后 

输出 j 是合 理的； 如果极小值出现一次以上，则再试一遍。（见 h )。） 

e ) 是的，假定自从最后一次用这种方式选择数字以来，时间是随机的。但是， 
在边界线情况下可能有偏倚。 

f ) ， g ) 否，人们常常设想某些数字（比如说 7) 具有更高的概率。 

h ) 是的； 你对马赋予号码时，把给定的数字赋予优胜马的概率是 

2.这种序列的数目是多项式系数1000000! /(100000!) 10 ;概率是这个数除以 
10 __0,即百万位数字的序列总数，由斯特林近似公式我们求得这个概率接近于 

1/(16 tc 4 10 22 /2^) ^ 2.56 x 10 -26 
大约在4 X 10 25 次中有一次机会。 

3.3040504030 c 

4. ( a ) 步骤 K 11 仅可从步骤 K 10 或步骤 K 2 进入，而且在每种情况下，我们通过 
简单的论证即知 X 不可能为0。如果 X 在这一步可以为0,则这个算法将不会终 

止。 

( b ) 如果开始时 X 是3830951656,则除了我们是以 Y = 3 而不是以 Y = 5 到达 
步骤 K 11 之外，这个计算和出现于表1中的许多步 类似； 因此3830951656 — 
5870802097。类似地，5870802097 — 1226919902^ 3172562687 — 3319967479 — 
6065038420— 6065038420 —…。 

5. 因为只可能有10 1(3 个10位数字的数，因此在头 10 1G + 1个步骤期间， X 的某 
个值必然重复，而只要一个值重复了，这个序列就继续重复它前面的特性。 

6. a ) 如同上题那样，可以论证这个序列最终必然会重复一 个值； 假设这个重复 
在步骤 "+ A 日^头一次出现，其中这个条件确定"和 A )。 我们有 

< m ，0< A < m ，" + A < m 。 当且仅当/是一个循环排列时，才达到 "=0 ，A = m ; 

而且出现 " = m - 1, A = 1，例如，如果 X 0 = 0, 则 ： r < 772 — 1时 f ( x ) = x 十1，而 /(7 n 
-1) = m ~ I o ' 

b ) 若 r > n ， 则当且仅当 r _ n 是 A 的一个倍数且时我们有又=。因 
此当且仅当 n 是 A 的一个倍数且时， = X ,,, 由此即得所求的结果。 [注: 
这实质上是一个熟知数学结果的证明，即在一个有限半群中一个元素的幂包括惟一 

的幕等兀：取 Xi = a , f ( x ) = ax o ] 

C ) 一旦找到了 77,对 1>0 生成足 和又 2 + 1 ，直到头一次发现足= 为止； 于 
是"如果对于 0< z </^， 尤 + z •的值没有等于尤的，则由此得出 A = 72,否则 A 
是这样的 t 中之最小者。 

7.8)使得？7 - (£( n ) - 1) 是 A 的倍数，而且 i ( n ) — fj . 的最小的??〉0是？?= 
2「 lgmax( 〃 + 1 ， A)1 -l + A 。 [可以把它和使得 X 2 „ = X ,最小的；2 >0比较，此即 A(「"/A 

+ 各"0)。] 

b ) 从 X = Y = X 0y k m = 1 开始。（在这个算法的关键处我们将有 X 二 
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m m = H 2 m -々）。）为了生成下一个随机数，执行下列步 骤：置 

X —/ U ) 和々一々-1。如果 X = Y ，就停止（周期长度 A 等于 m _々）。否则如果々 
= 0 ， 则置 Y — X ， w —2 m ， k — m 。 输出 X 。 

注： Brent 也曾考虑过更为一般的方法，其中 Y =尤的相继的值满足…= 0, 

% + 1 = 1 + L / m ,」， 其中/>是任何大于1的数。他证明，^的最好选择，近似于 
2.4771，同 p 二1 比较，大约节省了 3%的迭代（见习题 4.5. 4-4)。 

但是 b ) 部分中的算法有严重的缺陷，因为在停止之前它可能产生大量的非随 
机数。例如，我们可能有像 A = l，/i = 2 i 这样特别坏的情况。习题 6 b ) 中以 Floyd 的 

思想为基础的方法，即对于 w =0，1，2,…，保持 = 的方法，要求的函 

数计算比 Brent 方法多一些，但只要有一个数输出两次，它就停止执行。 

另一方面，如果/未知（例如，如果我们从外部源在线接受值，…）或者 

如果/难以应用，则下面由 R . W . Gosper 给出的循环探测算法将是可 取的： 当接受 
尤时保持一张辅助表 Td ，^ ，…， L ， 其中 m =Llg n 」。 开始时，置 T Q — X 。。对于 

n = l ，2, … ，把^ 同丁 。，… ， T [ lg , ; 」 中的每一个进行 比较； 如果找不到相符的，则置 

丁山,)—尤，其中以77) = 0^一|2^整除77十1丨。但是如果找到了一个相符 X , = T k , 

则 A = |/<72且 e (/)=^ L 在把尤存入 T +) 之后，它随后同 X …， 

尤 +2 ，".，尤 +2 “") + | 作比较。因此在生成 x 〃 + A +; (其中是满足 e(ju + J )> 

rigAl - 1 的极小值）之后，这个过程立即停止。通过这个方法，不会生成多于两次 

的 X 值，而且至多有 max ( l ，2 ilgA l _1 ) 个值生成 一 次以上 。 [MIT AI Laboratory 
Memo 239 ( 1972年2月29日 ）， Hack 132。 ] 

R . Sedgewick , T . G . Szymanski 和 A . C . Yao 已经分析了 基于参数仍 >2 和 g^l 

的一个更复杂的算法：在计算的时刻大小为 m 的一个辅助表包含…， 

X qb ，其中6 =2 「 lg 7 " 一且 q = [ nl ~ I 0 如果 " mod gb 〈 b ，就把同这个表的元 

素作 比较； 最终将出现相等，因此在对/至多进行（发十 l )2「 ls( " + A)1 + 1 进一步的计算 

之后，我们可以重新构造 y 和 A 。 如果对/的计算花费 r 个时间单位，而且如果对 

于&是否表中元素的检测花费 a 个时间单位，则 g 被选中使得总的运行时间是 

/ ^ \ 1/2 

+ A ) ( r + 0( — )); 如果 g\t — 0( m )， 则这是最优的。而且，除非 " + A > mn / 

\m j 

(说+吆+ 2)，否则又,不被计算，所以我们可以使用这个“在线”方法，来输出保证 

不同的元素，而对于每个输出只做2十 0 (m — 〃 2 )个函数计算 D [SJCOMP 11 
(1982),376 〜390。] 

8. a )， b )，00,00, … [62 个开始 值]; 10，10，… [19] ;60，60，… [15] ;50，50，… [1 ] ; 
24,57,24,57，〜[3]。（：）42或69;这两者都导致一个含有15个不同值的集合，即 

(42 或 69) ,76,77,92,46,11,12,14,19,36,29,84,05,02,000 

9. 由于 V ，我们有久 2 <6 2 '所以平方取中是|_又 2 /61<久 2 /沪。如果 X > 

0,则 X 2 lb f , < Xb ” lb ” = X 。 
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3 . 1 节 


10.如果则这个序列的下一个数有相同的形式，它等于 U 2 mo d 
沪。如果 a 是6的所有素因子的倍数，则这个序列将立即退化成0;如果不然，则这 
个序列将退化成为有和 X 相同的一般形式的一些数的循环。 

B . Jansson 已经发现了有关平方取中法的进 一 步的事实 .Random Number Gen ¬ 
era tors ( Stockholm：Almqvist & Wiksell , 1966 ),Section 3 A 0 数值学家们将有兴趣获 

悉下列事 实：数 3792在四位平方取中方法下是自再生的，因为3792 2 = 14379264;而 

且（如 Jansson 已经发现的），在另一种意义下它也是“自再生”的，因为它的素因子分 
解为 3 X 79 X 2 4 ! 


11. A 


1 ， " 


的概率是 x , = x 0 的概率，即 


o 


(" ，入） 


(0,2)的概率是和 X ,有某一个值的概率，所以它是 （1 



1)或(" 
，?. ）（ 1/ 


m ) 0 



似地，这个序列有任意给定的 p 和 A 的概率仅是 


+ 



的一个函数，即 


P(fjL ,X) 


m 



1 - 


k 


对于 A = 1 的概率，我们有 




m 



其中 Q ( m ) 是在1 .2.11 3小节等式 (2) 中定义的。由该小节的等式(25)，这个概率 

近似为〜 1.25/ v ^。 事实上，算法 K 收敛的机会仅仅大约为八万分 之一; 
作者的运气肯定是不好的。但也存在“巧合”现象，见习题15。 


12. 2 AP ("， A ) =丄(1十3(1_ 丄)十 

0 ^ JU >/1 


6 






1 + Q (y?2) 

2 


(见前面的答案。 一 般来说，如果/(〜，〜，•••）= _ k ! m)M f ( a 0y 

ai ，•••）=〜 + /(〜，〜，…） ~ f ( a l ，2 a 2 , … ）/??z ; 对 = ( tz 十 1 )/2 应用这个恒等 


式。）因此 ， A (而且，由 ， A ) 的对称性，也是"十 1) 的平均值近似于+专。 

p + A 的平均值恰为 Q (”2)， 近似于_+。[关于另一个推导和进一步的结 

果，包括关于当时的渐近值，见 A . Rapoport ， Bull . Math . Biophysics 10 (1948)，145 〜 
157 ，以及 B . Harris,Annais Math . Stat . 31 (1960), 1045 〜 1062; 也见 I • M . Sobol , 
Theory of Probability and its Applications 9 (1964) ， 333 〜 338 。 Sobol 讨论了对于更 
一 般的序列的渐近周期长度 这些 一 般的序列是 +1 = /( X n ) ，若？7吴0 ( modu ¬ 
lo ^ ) ; X 7 , + i = g ( X w ) , ^ ??三 0 (modulo m ) ;/ 和 g 两者都是随机的。] 

13 . [Paul Purdom 和 John Williams , Trans . Amer . Math . Soc . 133 (1968)，547 〜 
551 D ] 设是有”个一循环和没有长度大于 1 的循环的函数个数，贝 lj 


T 


run 



m 

n 






m 


))i ― n 
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习题答案 


(在习题 2.3.4.4-25 中这是_ n )。） 任何函数是这样一个函数后边接 

上那些构成一循环的；2个元素的一个排列。因此 = m ' 

设是最长循环长度为々的那些72个元素排列的个数，则最大循环长度为々 
的函数个数是为得到走的平均值，我们计算 由 

习题 1.3.3-23 的结果，它是 !(cn +| c + OU _ I ))， 其中0^62433。求 

和后，我们得到平均值 cQ ( m ) + + 0( m %)。 （当 X G 随机地选择时，这不比平 

均值大很多 。 max fx 的平均值渐近于 Q ( m ) In 4,而 max(/i + A ) 的平均值渐近于 
1 . 9268 Q ( m ) ;请见 Flajolet 和 Odlyzko , Lecture Notes In Comp . Sci . 434 (1990) ， 329 
〜 354。） 

14 .设 e ,( m ) 是恰有 r 个不同的最终循环的函数的个数。从递推式 ci ( m ) = 

(m _ 1 ) ! _ S * >。 ( = ) ( — 1 ) 々 （m - k ) k c x (m —々） ，我们找出解 c ^( m ) - m m ~ 1 Q 

( w )， 这个递推式是通过计算其映像至多含有 m - k 个元素的函数个数得出的（见 

习题 1.2.11. 3-16)。得到 Cl ( 777) 的另一种方式，也许是更优雅和更有启示的方式，在 

习题 2.3.4.4-17 中给出。 Q ( m ) 的值可以像在习题13中那样 确定： 



V T 

/ 1 ± my\ 
1 



现在可以计算出所求的平 均值； 它是（见习题 12) 


= 


m 





2 FI 2 


m 


一 1 



3 H 


m 


—1 m — 2 


m 


3 


+ 


m 


m 




?n — 1 m — 2 
mm 





这后一 ^ 公式是用 Martin D . Kruskal 给出的十分不同的手段得到的，见 AMM 61 

(1954),392-397 o 利用积分表示 


E 


m 




dx 

x 


他证明了渐近关系 lim m _.co | E ni 




(7 十 ln 2)。 关于进一'步的结果和参 


考文献，见 John Riordan , Annals Math . Stat . 33 (1962) ， 178 〜 185 。 

15 .对于所有的 x y f ( x )^ x 的概率是 （m - l) nl I m m ，它近似于 1/ e 。 因此在 一 
个像算法 K 这样的算法中，存在一个自重复的值，这一点也不奇怪——它以1 - 1/ e ^ 
.63212 的概率出现。惟一“巧合”的事情是当随机地选择时，作者碰巧地遇到了 


这样一个值（见习题11)。 

16.当一对相继的元素第二次出现时，这个序列将重复。极大周期是 m 2 (参照 
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3.2.1 小节 


下一个习题）。 

17. 在任意选择 Xo , …，丨. M 之后，令 X „ + 1 =/ U „，— 々 + 1 )，其中 0< Xi ， 

…， A < m 意味着0</( jc : ，…， ) < m d 极大周期为这是 一 个明显的上限， 

但上限可以达到并不 明显； 对于适当的/，它总是可以被达到的，有关这一点的构造 
性证明，请看习题 3.2.2-17 和习题 3.2. 2-21，关于达到它的方式数，见习题 2.3.4.2- 

23o 

18. 和习题7—样，但是使用々元组（；^，…， X „_, + 1 ) 代替单个元素； C ,。 

20. 只须考虑由步骤 K 2 〜 K 13 所定义的较简单的映射就足够了。由 
6065038420往后工作，我们得到总共有597 个解； 最小的是0009612809，最大的是 
9995371004。 

21. 我们可以像上道题一样通过 g ( X ) 来工作，但现在我们要向前运行函数而 
不是向后。在时间和空间之间有一个有趣的折衷。注意步骤 K 1 的机制趋向于使周 
期长度变小。对于大的入度 X 的存在性也是 这样； 例如，在步骤 K 2 中 X = 
*6* ***** * ^■的512种选择也将以 X — 0500000000转到 K 10。 

Scott FIuKrer 发现了算法 K 的另一个不动点，即值5008502835 ⑴。 他也发现 
了周期为3的 0225923640—2811514413—0590051662— 0225923640,并生成全部7 
个周期。恰有128个起始值导致重复的值5008502835;其中最小的是0008502835, 
最大的是9944390948。算法 K 是一个糟糕的随机数生成程序。 

22. 如果/真正随机的话，这将是理 想的； 但我们怎样构造这样的/呢？在这样 
的方案之下由算法 K 定义的函数要工作得好得多，尽管它确实有肯定非随机的性质 
(参见上 一 个答案）。 

23. 函数/排列它的循环 元素； 令，…，是该排列的逆的“非寻常的”表 

不。然后像在习题 2. 3. 4. 4-18 那样来定义，…，：-丨。 [ 见 Combinatorial 
Theory 8 (1970) ，361 〜 375。 ] 

例如，如果 m 二 10且（/⑻， …， /⑼） = (3,1，4,1，5,9,2,6,5, 4), 我们有 
(工 0 ，…，: r 9 ) = (4 ，9，5 ， 1 ， 1，3，4，2，6 ， 5) ;如果（: c 。 ，…， 工 9 ) 二(3，1，4，1，5,9,2,6,5, 

4), 我们有（/(0)， …， /(9)) = (6,4,9,3，1，1，2,5,4,5)。 

3.2.1 小节 

1. 取为偶数， a 为偶数， c 为奇数，则对于 n >0, X w 为奇数。 

2. 设 X ,.是这个序列中头一个重复的值。如果对于 0< A < r 中的某个々有 I 

等于&，那我们就可以证明尤^ = & — i ，因为当 a 与 m 互素时 ， X „ 惟一地确定 
X . — i 。 因此々=0。 ’ 

3. 如果 d 是 a 和772的最大公因子，则至多可以取 m / d 个值。情况甚至可 

以 更坏; 例如，如果 m =2 g 且^为偶数，则等式 (6) 说明这个序列最终是常数。 

4. 对々用归纳法。 

5 .如果 a 和 m 互素，则有 一 个数 a ’， 使得 aa =\ ( modulo m ) 。 于是 -丨= 
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习题答案 


{ aX n ~ a c ) mod m ，一般来说，当々 >0 , 72 -々>0时， 

^ n-k = ((a ) k X n - c(〆 + …+ (a ) k )) mod m — 

(( a ' ) k X n + (( 〆 )々- 1) cl b ) mod m 

如果 a 不与 m 互素，则当给定时，不可能确定 X ri - io m / gcd (a y m ) 的倍数可以 
加到总-:上而无须改变的值（也见习题 3.2. 1.3-7)。 

3. 2 . 1 . 1 小节 

1 •设^是同余式 a〆 三 c (modulo m ) 的解（于是，如果 〆 是习题 3 . 2 . 1 - 5 的答案 
中的数，则 c ' = a c mod m ) ，我们有 

LDA X ; ADD CPRIME ; MUL A 

这个加法运算有可能导致溢出。（由本章后边导岀的一些结果，可知最好的办法大 
概是取 c = a 并以 “INCA 1”代替 ADD , 以节省一个时间单位。这样，如果 X D = 0, 则在 

周期结束之前将不出现溢出，所以实际上溢出不会出现。） 


2.RANDM 

STJ 

IF 



LDA 

XRAND 



MUL 

2F 



SLAX 

5 



ADD 

3F 

( 或者，如果 c 很小，则代之以 INCA c) 


STA 

XRAND 


1H 

JNOV 




JMP 

*-l 


XRAND 

CON 

X 0 


2H 

CON 

a 


3H 

CON 

c 1 


3 ■令 a = 

aw mod m ， 并令 

m 使 4 守 mm =1( modulo vu 、 0 置 ： y —lomult ( a ， 

: r)，z — himu ! t(a ，: r ) ， Z — lomult ( m ，: y ) ，“ — himult ( ttz ， jO 。于是我们有 rnt — 

a x (modulo vu 

) ，因此 a x ~ mt - 

- ( 2 ： w)w ， 因此 ax — z w (modulo m ); 由此得出 

ax mod m — z 

—« + 

. 2： < W ] 。 


4 . 当且仅当 ： r 一 

Mmodulor) 和 -2 「 时定义运算 : c = 由 


y 0 = X 0 mod 2 32 ， y„ + 1 = ( aY n + c ) mod 2 32 


定义的同余序列〈匕>在 370 型机器上很容易计算，因为对所有 2 的补码数 3 ； 和 z ， 3 , 
和^的乘积的低半是（，）_ 2 32 ,而且因为忽略溢出的加法所提供的结果也是 
_ 2 32 的。这个序列有标准线性同余序列的全部随机性，因为 = 
(modulo 2 32 ) o 其实， I 的2的补码表示，对所有 77 都等同于尤的二进表示 [ G . 
Marsaglia 和 T . A.Bmy 在 CACM 11(1968),757-759 中首先指出这一点]。 

5. ( a ) 减法: LDA X;SUB Y; JAM * + 2; ADD M 。（ b) 加法: LDA X;SUB M;ADD Y;JANN*+ 2; 

ADD M 0 (注意，如果 m 超过字大小的一半，则指令 “SUB M” 必须在指令 “ADD Y” 之前。) 
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6 . 这些序列实质上并无二致，因为加常数 （m - c) 和减常数 c 有相同的效果。 
由于这个操作必须和乘法相结合，减法过程几乎不比加法过程更优（至少在 MIX 的 
情况下），除非有必要避免影响溢出开关时。 

7. 在 -1 的因子分解中出现有 ^-1 的诸素因子。如果 r 是奇数，则 d 十 1 
的素因子出现于 + l 的因式分子中。而且 2 2 々 -1 等于 （ ^-1)(3 + 1 )。 


8. J0V 

* + 1 

( 确保溢出是关闭的） 

LDA 

X 


MUL 

A 


STX 

TEMP 


ADD 

TEMP 

加低半部到高半部 

JN0V 

务十 2 

如果大于等于加则减 w- 

INCA 

1 

在这一步不可能产生溢出 


注 ：由于 在一台 e 个二进位1的补码计算机上加法是在 mod (2" - 1) 下进行的， 
因此有可能把习题4和习题8的技术结合起来，对于所有1的补码数^和 H 不管符 
号），通过把乘积的两半（各有 e 位）加在一起产生出（: V2 ：) mod (2"" - 1) 。 

9. a ) 两边都等干 aql.rlqlo 

b ) 置 t^~a ( x mod 其中 r — m mod a ; 可以预先计算出常数 g 和 

r o 然后 a：r mod ;?2 = / + [^〈0]7>2，因为我们可以证明£〉 _ m : 显然 a{x mod q ) 
《 a、q - 1) < m 。 如果 0< r^q , 也有 rlxl q ]^ r \_( m - l )/ g 」= r|_a + (r - 1)1 q ]~ 
;^<糾〈？/1;而且“ 2： ^772意味着「〈<2<<7。 [ B . A . Wichmann 和 I . D . Hill 发表的程 
序中隐含了这一技术 , Applied Stat . 31 (1982) ，190。 ] 

10. 如果且1 = 爪 _ 1，我们有 rLi/<?」Xy + l)(a + l )〉 w 。 所以对于 

方法9 b ) 的有效性来说，的条件是必要和充 分的； 这意味着 

q q 

令 z = 对于 l < q < t 来说，区间 f 1,^1是不相交的，而且依赖于 g 是 

L q 9 」 

否 m 的一个因子，它们精确地包括1或2个整数。这些区间用做对于的所 
有解；它们也包括，如果 mod 1)< 1/2则 a = t 以及如果 w = i 2 , 则 a = t ~ I 

的倩况。因此“幸运乘数”的总的个数精确地为 2 L /:」+ L d ( m )/2」 - 
、\Tm mod 1) 〈+ -1， 其中是 m 的因子的个数。 

11 •我们司以假定 a < j 77?;否则由（州- a ) x mod m 我们可以得到 <2 j : mod 

m 。 于是我们可以表示 a 二， a 〃- a ' 其中 a 、 和，都小于例如，我们可以 

取 a 7 = m - 1 和 a " 二「 a / a ' 1。由此得出 ， ax mod m 是 （ a ' ( a " :r mod m ) mod m 
-- ( a ，r/ x mod m ) ) mod m ，而且内部的三个运算都可通过习题 9 来处理。 

当 m =2 31 _ l 时，我们可利用 m -1 有192个因子这个事实来找川= qa ' + \ 
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习题答案 


的那些情况，以简化一般的方法，因为，=1。结果是，当 a =62089911时，在这些 
因子中有86个导致幸运的 a 〃和 a ' 这样的最好情况大概是3641,^= 17053, 
a "' = 62,因为3641和62两者都整除 m _ 1。这个分解产生了下列方案： 

t — 170530 mod 125929) - 16410 L ^：/125929 J 
t — 3641 (z mod 589806) - U /589806」 
t — t — (62( x mod 34636833) - L ^ c /34636833 j ) 

其中表示模州减法。模运算用做 一 个乘法和一个减法，因为 z mod q — x ~ 
gLWd ， 而且运算 U / g 」 已经完成了；因此，我们已经实施了 7次乘法，3次除法和7 
次减法。然而甚至更好的是注意到62089911本身有24个 因子； 它们导致5个具有 

0的适合的因子分解。例如，当，= 863和 a "=70317 时，我们只须6次乘法， 

2次除法，4次 减法： 

t 一 883 (x mod 2432031) - 274|_工/2432031」 
t — 70317(^ mod 30540) - 2467 U /30540」 

[对于所有的 a 和 m ， 乘法和除法的最坏次数能否减少到至多11，或者12是否最好 
的上限？另外一个实现12次的方法请见习题4.3.3-19。] 

12. a ) 令 m = 9999998999 = 10 10 - 10 3 - 1 0 为了以 10乘 U 9 ： r 8 …： c 0 ) I0 模 m ， 使 

用 10 w x 9 =10 3 x 9 + x 9 这一事实 ：即加 （: ^000) 10 到（工 8 工 7 " •: c 0 : r 9 ) 10 。 并且为避免循 

环移位，想像这些数字被安排在轮子上：就是把高阶数字 A 加到向左移三个位置的 
数字：^上，并指向 ： r 8 作为新的高阶数字。如果 x 9 + : r 2 >10, 则一个进位向左传 
播，而如果这个进位一直前进到： r s 的左边，它不仅向 A 传播，而且也向： r 2 的位置 
传播； 在最后安置停当之前，它可能继续既从： r 9 也从: r 2 传播。（这些数也可能变成 
稍大于川。例如，0999999900变成9999999000 = m + 1,它又变成9999999009 = 

77? + 10。但是 一 个冗余的表不未必是有害的。） 

b ) 这是除以10的运算，所以我们做的是 a ) 的对立面 ：循环 地向左移动高阶数字 
的指针，并从数字左边三位减去新的高阶数字 o 如果减的结果是负，则以通常方式 
“借位”(算法 4.3.1 S ); 即前边一位数字减1。借位也可能像在 a ) 中那样传播，但是 
绝不会超过高阶数字。这个运算保持诸数字为非负，而且小于州。（因此，除以10 
被证实是比乘以10容易些的。） 

c ) 我们能记住借位而不是传播它，因为它可以加入到下一步的减法中。因此， 
如果我们定义数字 A 和 借位乂 ，通过递推式 

X „ =(心― 10 - 工„_ 3 - b n ) mod 10 = ^^-10 - x „- 3 -乂 + ⑽川 

我们通过对 n 的归纳法有 9999999000" mod 9999998999 = ，其中 

ti _ ( OC t] X n — 2 _OC n JC n X 7l JC n n —~j JC n ^-2^- n+\ ^ n ) 10 1000 b n + 2 _ 

假定初始条件被建立使得 X Q = 1。 注意 

10 X „ +1 = 3 U „— 5 A —6 h +3:«+2 :n + lO )10 - 10000 乂 +4 = 

• 500 . 


3.2 丄 1 小节 



mx y} + X y] 

由此得出，对于所有的 72>0,0< X „< m 。 

d ) 如果 0 < L /< m ， Ulm 的十进表示的头一位数字是 LlOL // m 」， 而且随继的数 
字是 （ 10 L / mod m)l m 的十进表 7K ; 例如，参看 4.4 节中的方法 2a 。 因此 Ulm = 

(• 以 0 2 ".) 10 ，如果我们置 L/ 0 = L 7 和 = 10 U 7} - I mod m = lOL ^ -丄 _ mu n 的话。 

简略地说， 1 / m 的数字是对于 ;2 = 1 , 2 ,…， 10 ” mod m 的前导数字，即最终成为周期 
的一个序列。这些是在相反次序下 Hr”mod 772的前导数字，所以我们在 c ) 已经计 
算过它们了。 

一 个严格的证明当然比仅仅接受它更为可取。设 A 是使 10 A ^ l ( m O dul O m ) 的 
最小正整数，并且对于所有72 <0,定义 x n — X n mod X ， b n — b n X Tl = X n mod A o 于 


是 c ) 中对于 X , , b n 和； ^ 的递推式对于所有整数 n 成立。如果 [； Q = 1 ， 由此得出 

I；，,=叉-„和〜 = ，因此 


999999900 n mod 9999998999 

9999998999 



2^-3... 



e ) 设 w 是计算机字的大小，使用递推式 

X n = ( x n -k - 工”-[一 b n ) mod zv = x n ^ k - x n ^ t - b n + ujb tl + i 

其中 0 < / < A 且々 很大。于是 （.： r „ _ - 2 了„ - 3 …），其中 m - vo k - uJ - 

1 且 X n + i = ( VU k ' 1 — W l ~ l ) X n mod 777 。 对于 77 X ) ，关系 



••钃 


>1 




n 


成立； X - i ， …，: r — A 和 6o 的值应该使得 0 < Xq < 772 o 

这样的随机数生成程序，以及在下列习题中的类似程序，是由 G . MarsagUa 和 
A . Zaman 引进的 [ Anna/s of Applied Probability 1 (1991)，462 〜 480 ] ，他们把它叫做 

带借位减法 方法。他们的出发点是分母为772的分数的 W 进制表示。与线性同余序 

列的关系是由 Shu 丁 ezuka 注意到，而由 Tezuka ， L ’ Ecuyer 和 Couture 详细分析的 
[ACM Trans . Modeling and Computer Simulation 3 ( 1993 ) ， 315 〜 331] 。习题 

3.2.1.2-22 中讨论了周期的长度。 

13.乘以10现在要求把被加的数字取负。为了这一目的，把一个数表示成最后 
三位数字取负是方 便的； 例如，9876543210 = (9876544 7豆5) 1 () 。然后10乘（: r 9 -" 


•rpypoho 是（ : r 8 … X3-2：' x { x^x 9 ) 10 , 其中： r' = X9 _ 工 2 。类似地 （:… 
xshiix 。）! 。除以 10 是（ 2 。工 9 …： x - X^o 递推式 


X n =( 工 ”—3 - 1”-10 — \ — 1 ) mod 10 = 工 ” 一 3 — 工 ” -10 - 匕一 1 十 106 ” 

产生8999999101” mod 9999999001 =，其中 

- (了”一1 工 ” 一 2义；7-3工”-4工;?一52，〗 -6工”-7工 w +2 工” + Ll ”） K ) + 10006 ”+3 - 

(工，，—1 工” — 2 • • * 工” - 10 ) 10 _ (工/2 — 1 上，] — 2 了” - 3 ) K ) + 

当把进制从10推广成时，我们发现， W 的逆幂模 tt / - Tt / + 1由 
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习题答案 


= (h - x n ^ k - b n ) mod vu = — / — x n ^ k ~ b n ^ zvb n + l 

生成（和习题 12 相同，但 々和 / 交换）。 

14•温和的推广 ：对于 任何小于或等于字大小 w 的我们可以有效地来做除以 
b 模因为当 b < w 时对于〜的递推几乎和当6 = w 时的递推一样有效。 

强的 推广： 如果我们定义 

k 

m 二 a kb k + …+ a,b -I 和 X ” = ( — — + c,)(sign m ) 

} — 1 

则在 Xj\?n I 二 （. 心_ 1： ^_ 2 …） 6 的意义下，递推式 


X 



n 



+ “k 工 n-k + c ，）mod b ， 


c n^\ 



a \ X n-\ 





等价于 mod I ml 。应该把初始值:…和 4 选择成使得 0< X 0 < 
U I ;那我们将有对于 n>O y x }1 = (bX n + l ~ X n )!\m. I o 对于 7 <0 出现于公式 
X nl I rn I = (. l —— 2 …） 6 中的 X 」的值被适当地当做: ^ mod A ，其中 b x = l ( modulo 
m ); 这些值可能不同于开始时被提供的数 ，…， i 进位数字将满足 


5] min (0, a ; ) < < X ) max (0 ? ) 

尸 i j = 1 

如果初始的进位是在这个范围的话。 

特殊情况 m 二 b k + b l - 1，对于它…=心+ (^，是有特别意义的，因为它可被容 

易地计算 ； Marsaglia 和 Zaman 把它叫做带 进位加 法生成 程序： 

x n = (^ n-i + oc n - k + )mod b = x n ^ l + x n - k 十 - bc n + l 

另一个潜在的有吸引力的可能性是在对于比如说6 = 2 31 和772 = 654306 2 ^ b ~ 
1的生成程序中使用 k = 2 0 这个模数 m 是素数，而且周期长度结果是 （m -1)/2。 
3.3. 4小节的谱检验指出，平面之间的间隔是好的（很大的 y 值），尽管与对于这个 
特定的模数 rn 的其它乘数作比较，乘数 6 — 1 当然是差的。 

习题 3.2.1.2-22 包含关于带借位减法和带进位加法的模数的另外信息，这些 
模数导致极长的周期。 


3.2 1.2 小节 

1. 由定理 A ， 周期长度是 m (参见习题3)。 

2•是的，这些条件意味着定理 A 中的条件，因为仅有的素因子是2,而且任何 
奇数同 2 e 互素。（事实上，本习题的条件 是必要 和充分的。） 

3 .由定理 A ， 我们需要 a 三 1 (modulo 4 ) 和 a. 三 1 (modulo 5 )。 由 1.2.4 小节的 
定律 D ， 这等价于 a = \{ modulo 20) 0 

4 •通过在州=2 ( - ：1 的情况下使用定理入，我们知道 X 2 -'=0 (modulo 2 t " 1 )o M 
于 m =2 e 也使用定理 A ， 我们知道 X 2 ^->^0 (modulo 20。由此得出， X 2 -> -2^ 1 0 
更一般地，我们可以使用等式 3.2.1-(6) 来证明，这个周期的第二半实质上和头一半 
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是相类似的，因为 + = ( X „ +2^ ! ) mod 2、（四分之 一 也是类似的，见习题 

21。） 

5. 对{ = 3，11，43,281，86171，我们需要0三1(爪0(11110/))。由 1.2.4 小节的定律 
Do 这等价于 a 三 l(modulo 3* ll*43*281*86171)， 所以惟一的解是糟糕的乘数 a = l Q 

6. ( 参见上一习题。）同余式 “ = l ( modiil 0 3*7_11*13*37)意味着，对于0<々< 


8,解是 a = l + inillko 

7. 使用引理 Q 的证明的符号，^是使得 \ + A = \的最 小值； 所以它是使得 
y ^ + x ~ 和 Z〆 久二 Z " 的最小值。这表明 " = max ( ，…， ",） 。可实现的最高的 

( jl 是 max ( q ，…，^ ) ，但没有人会真正要实现它。 

8. 我们有 a 2 ^ l(modulo 8) ;所以 a 4 三 1 (modulo 16) y a s = l (modulo 32) ，等等。 

如果 a mod 4 = 3 ， 贝 !j a — 1是 一 个奇数的两倍；所以 （ a 2 _ 1) I (a - 1 )^0 (modulo 

20当且仅当 ~ l )/2-0 (modulo 2 g + t /2)， 它为真。 

9. 借助于八替换并作简化。如果 X Q mod 4 = 3,这个习题的公式不 适用； 

但它们确适用于序列 Z , = ( - X , ) mod 2' 它实质上有相同的特性。 

10. 对于奇素数/)，仅当 m = 1,2,4,/和2妒时 Q 在所有其它情况下，定理 B 

的结果是对于欧拉定理（习题 1.2.4-28) 的改进。 

11. ( a ) : r + 1 或: r -1 (但非二者）将是4的倍数，所以其中 g 是奇 

数而/大于1。 （ b ) 在给定的情况下， /< e ， 所以我们有 + x 三 Kmodulo 〗/) 
和土: c 吴 l ( modul 0 2 /+1 ) 以及/>1 0 因此通过应用引理 P ， 我们求得 （土 — 舍 

1 (modulo 2 e ) ，而： r 2 = ( ± x ) 2 三 1 (modulo ) 。所以阶是 的 一 个因子，而 

不是 2〃/— 1 的一个因子。 （ c ) 1有阶 l ;2 e - 1有阶2 ; 因此当£>3时极大周期是 
2 e_2 , 而对于 就需要有 /=2,即 + 1 (modulo 8)。 

12. 如果々是 p -1 的真因子，而且如果 a ' - 1 (modulo />)，则由引理 P ， 我们有 

a kt> =1( modulo p e ) 0 类似地，如果 V -1 三 l(modulo p 2 ) ，则我们发现 — i);> = 
1( modulo p e ) o 所以在这些情况下， a 不是本原的。反之，如果 a p ^ l ^ l ( modulo 

p 2 )， 则定理 1.2.4 F 和引理 P 告诉我们， ( modulo 纩），但是 a (” 

( modulo ^) o 所以阶是 （ f -1 )〆 — 1 的因子而不是（户 -1)， _2 的因子；因此它有 

1 的形式，其中々整除 f -1。 但如果 a 在模 > 下是本原的，则同余式 '三 a k 
=1 (modulo />) 意味着 k 二 p _ \。 

13. 设 a mod p 夺0 且设 A 是 a 的模阶。由定理 1.2.4 F ， A 是 p _ l 的因子。 


如果 A <>-1， 则 （ p - l )/ A 有一个素因子心 

14■设 0<々< p 。 如果 V -1 三 1( modulo ) ，则 （ a + kp ) p ~ [ ^ a p ~ 1 + (p - 1 ) * 


a 


P-2 


modulo p 2 ); 而这是吴 1 的，因为（/ > — l ) a /; 


■■7 



不是 p 的倍数。由习题12, 


a + kp 是模，本原的。 

15. ( a ) 如果 A ! = ， A 2 = pH ，设 q … ， fc 2 : p } V … p h t ! ，其中 
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习题答案 


& 且/^ =0， 对于〜 < 力 

= 0且~ = fj ， 对于〜 >力 

现在，和 〆 22 有周期 Ai /心 .和 A 2 // C 2 ，而且后者互素。其次， A ， 
所以只须考虑与 A 2 互素的情况，也就是当 A = A , A 2 时的情况。现在由于 

我们有 lE ( a f 2 ) / U iE a 〗 A i ; 因此；^ 是；^ 的倍数。这意味着 A 是义 2 
的倍数，因为与 A 2 互素。类似地， A 是; li 的 倍数； 因此 A 是 A t A 2 的倍数。但显 

然（〜以）^三1，所以 A = AiA 2 。 

( b ) 如果〜 有阶 A ( m ), a 2 有阶 A ，则由 U ) 可知， A ( m ) 必须是 A 的倍数，否则 
我们可以找出一个更高阶的元素，即 lcm ( A ， A ( m )) 阶的元素。 

16.a) /U) = (：c _ a)U” _1 + (a + q)x” _2 + …+ (^- 1 4■…+ +y ( a )。 

b ) 当 72 =0 时这个命题是显然的。如果 a 是一个根，则 f ( x ) = (x - a ) q ( x ): 
因此如果 a '是任意其它的根，则 

0三 /( 〆 ）三 ( a , - a ) q { a ') 

而且由于， - a 不是 f 的倍数， 〆 必是 g (: r ) 的根。所以如果 / U ) 有多于 n 个不同 
的根，则 gU ) 就有多于1个不同的根。 c ) A (/>)>/> -1，因为为了具有这样多 
的根， / U ) 必须有大于等于 p ~ l 的次数。但由定理 1.2.4 F ， A ( f )< p - l 。 

17 • 由引理 P ， II 5 三 1 (modulo 25) ， II 5 (modulo 125)，等等；所以 11 的阶是 

模51,不是极大值 A (50 = 4*5^ 1 o 但由引理 Q ， 总的周期长度是周期模 Z 
(即2^ 2 )和周期模51即 5^) 的最小公倍数，而这就是 y - heMsAaOO 。 周期模 
可以是 y - 1 或 IS 6 — 1 或心5^，而不影响周期模 1( T 的长度，因为取了最小公倍 

数。在模下为本原的一些值，是同余于2,3,8，12，13,17,22,23模25的那些值 

(参考习题 12)，即 3,13,27,37,53,67,77,83,117,123,133,147,163,173,187,197 c 

18. 根据定理 C，a mod 8必然是3或5。知道了 a 模5和模25的周期，我们就可 
以应用引理 P 以确定 a mod 25的允许的值。周期= 4.5〃 1 :2,3,8,12,13,17,22,23; 
周期 =2.5 e — 周期 = 5〃 i : 6， ll ，16,21。 这16个值的每一个产生出 a 的 

一个值 ,0 ^a < C 200，满足 a mod 8 = 3,以及另一 '个 a 的值，满足 a mod 8 = 5。 

19. 表 3. 3 .4-1 的行17〜20中有若干个例子。 

20 . a ) 当且仅当 Y n == Y n + k ( modulo m ’） 时我们有 AY n + X 0 = AY tl + k + Xq 

(modulo m ) 0 b ) ⑴显然。 ( ii ) 定理 A 。( iii ) 当且仅当 a ” 三 l(modub 2 e + 1 ) 时 （，- 
1 )/(a - 1)=0 (modulo 2 e ); 如果 a 吴 -1， a 模 2 e + 1 的阶是它模 Z 的阶的两倍。 （ iv ) 
当且仅当 a n = \ 日寸， （ a ” - 1)1( a - 1)^0 (modulo p e ) o 

21 . 由等式 3.2. H 6) 知三 & 十足； 而且 5 是 m 的因子，因为当奶是户的 

幂时 s 是> 的幂。因此一个给定的整数 y 是 mis 的倍数当且仅当当且仅当 
g 是 m / gcd ( X 5 , m ) 的倍数。 

22■算法 4.5.4 P 当比如说6〜2 32 和 l < k ^ l 00 时有能力在相当的时间内测试 
形如 m = b k ± b l ±1 的数是否为 素数； 这些计算应当在6进制之下进行使得 m 的特 
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3.2.1.3 小节 


殊形式加速平方模 m 的运算。（例如，考虑在十进制下平方模9999998999。）当然， 
算法 4.5.4 P 仅当已知 m 没有小的因子时才应被使用。 

Marsaglia 和 Zaman[Annals of Applied Probability 1 (1991),474 〜 475] 证明，当 

心是素数2 32 - 5时 ， m = V 3 - V 2 + l 是有原根6的素数。这要求进行因子分解 m 
-~ l ^ b 22 ( b - l )( b 6 + b 5 + b 4 + b 3 + b 2 + b + l )( b u + 6 7 + 1) 以便确定 6 的本原性。 
772-1 的17个素因子之一有99位十进数字。结果，我们可以确保序列^ ? = (^- 22 

- 工 n - 43 — c n ) mod b = X n -22 ~~ ~ c n + bc n + 1 当 c 0 = 0 时对于种子值 

的每一个非零的选择有长度 m - 1〜10 414 。 

然而，从生日间隔检验的观点（见 3.3.2 J 小节）来看，对于々来说43是相当小 
的值，而且22相当接近于43/2。“混合”的考虑表明，我们喜欢在 ZM 的连分数中头 
一 些部分商是小的那些 々和 Z 的值。为了避免这个生成程序的潜在问题，好的想法 
是如 LQscher 所建议的那样，拋弃某些数(参见 3.2.2 小节）。 

这里是形如 b k ± b l ± l 的一些素数，当 b = 2 32 m 50<^<100时满足混合的限 

制：对于带借位减法 y b 51 - b n - l , b 13 - b ll - l . b S 6 - b 62 - l 7 b ^- b 52 - Ub 95 ~ b 6[ 

- 1; 6 58 -心 33 + 1，6 62 - b xl + 1,^ 69 - ^ 24 + 1, b 10 — 6 57 + 1，心 87 - b u + lo 对于带进 

位加法，6 56 + 6 22 - 1， 6 61 + ^ 44 - 1, b 14 + 6 27 - 1, b 90 + 6 65 - 1。（从混合的观点看不 
大合乎要求的是素数办 56 ~ b 5 ~ l y b 56 - b n ~ l y b 66 ~ b 51 - l , b 16 ~ b 15 - l , b S4 ~ b 26 
- l . b 90 ~ b 42 ~ Ub 93 - b l& ~ l ； b 52 - l ^ b 60 ~ b 12 ^ l , b 61 ~ b 8 ^ l , b 67 ~ b 63 ^ l . 

b 83 - b 14 + l ;^ 65 + b 2 - l ,^ 76 + b n _ 1，心 88 + 办 30 _ 1’6 92 + 6 4S _ 1。） 

为了计算得到的序列的周期，我们需要知道 m -1 的 因子； 但对于这样大的数 
这是不可行的，除非我们极端幸运。假设我们在寻找素因子，…，&中确实成功, 

则 b { m ~ X ) iq m 0 d 772=1的概率极小，仅为1~,除非 g 是非常小的素数。因此，我们 
可以十分确信，即使不能对 m - 1进行因子分解 ， fmod m 周期也是极长的。 

确实，即使 m 不是素数，这个周期几乎肯定地是非常长的。例如，考虑 A = 10, 
Z = 3,6 = 10 的情况（对于随机数生成来说它是太小了，但是足以令我们能容易地计 
算出精确结果）。在这种情况下，〈10” mod m ) 当 m = 9999998999 - 439 - 22779041 
时有周期长度 lcm (219, 11389520) = 2494304880;而当 m = 9999999001 时为 
4999999500;当饥=10000000999时为5000000499;以及当爪=10000001001 = 3- 
17.2687.72973 时，为 icm ( l ， i 6,2686，1216； Z ) = 130668528。当 m 不是素数时，种 
子的稀少选择可能缩短周期。但如果我们选择比如说 A = 1000 ,Z = 619 和 b =2 l \ 
我们几乎不出错。 


3 2.1.3 小节 

1 . c = l 总是与 B 5 互素； 而且每一个整除 m 二 B 5 的素数是 B 的一个因子，所 
以它整除 b = B 2 至少到第二次幂。 

2 . 只有 3, 所以不管它的周期如何长，也不推荐这个生成程序。 

3 . 在两种情况下，效能都是 18( 见下题）。 
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习题答案 


4■由于 a mod 4= 1，我们必然有 a mod 8 = 1或5,所以办 mod 8 = 0或4。如果 
6是4的奇数倍，而且如果~是8的倍数，则显然 =0( modulo 20意味着 b \ = 
0 (modulo 20，所以\不能有高于6的效能。 

5. 效能是錡于所有的 ； ，使得的最小 s 值。 

6. 为了有像4这样高的效能，模必须能被2 7 或 p 4 ( p 为奇素数）整除。仅有的 

值是 m =2 21 十1 和10 9 _1。 


7. a ' = (1 - 6 + 6 2 - )mod m ，其中等项都被去掉了（如果 s 是效能的 

话）。 


8 .由于总是奇数 ，X 


n 


2 


(2 


34 


+ 3-2 


18 


+ 9) X ， 7 mod 2 35 


(2 


34 



6 X 


9 X 


mod 


给定^和 


n 


Y 


+ 


(5 + 6( Y … + q )-9( 


mod 10 


的可能性是有限而且是非随机的，其中 0< q < l ，0< q < l 。 


注 ：如果 在习题3中所提岀的乘数，比如说是2 33 + 2 18 + 2 2 + 1，而不是2 23 




则我们将类似地求出 X 


10 X 


>2 


+ 



25 X ,,三常数 （modulo 


o 


般 


来说，当 S 很小时，我们不要求 a ± d 为2 的高次幂所整除，否则我们就得到“二阶 
低效能”。关于更详细的讨论，见 3.3.4 小节。 

在 MacLaren 和 Marsaglia 的论文中可找到有关本习题中的生成程序的讨论，见 

JACM 1 2 (1965)，83〜89。 M . Greenberger 首先揭示了这种生成程序的缺陷 ， CACM 

8 (1965),177 〜 179。但是这样的生成程序后来仍然广泛使用达10年以上（参看 3. 
3.4 小节中关于 RANDU 的讨论）。 


3.2.2 小节 

1. 使用这个方法时必需非常小心。首先， aR 可能是如此之大，使得后面的对 

dm 的加法几乎将失去所有有效位，而且 “mod 1”操作将近乎破坏可能剩下的任何 

有效位的痕迹。我们的结论是，双精度浮点算术是必要的。即使用了双精度，人们 

必须确保无论如何不会出现舍人等等事情，来影响序列的数，因为这将破坏这个序 
列好的特性的理论基础（但见习题23)。 

2. 尤 + 1 或者等于 + 或者等于+ X „ - m 。 如果 & + ，我们 
必定有 i =尤_ ；[ + _ m ;因此尤 + ! < 。 

3. ( a ) 在步骤 M 3 之后有下划线的数是 V [ j ]。 所以效能已经减小成1!(见习 


题15的答案中的进 一 步的注解。) 
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( b ) 在步骤 B 2 之后，有下划线的数是 V [ j ] o 在这种情况下输出比输入好得 
多： 



在46步之后它进入长度为40的一个重复循环：236570 05314 72632 40110 37564 
76025 12541 73625 03746(30175 24061 52317 46203 74531 60425 16753 02647)。 

通过把习题 3.1-7 的方法应用到上边的数组直到有一个列重复出现为止，可以容易 

地找到这个循环。 

4. 许多随机序列的低位字节(例如，对于 w =字长的线性同余序列）比起髙位字 
节的随机性要差。见 3.2.1.1 小节。 

5. 随机化的效果将被极小化，因为总是包含某个范围内的一个数，实质 

上有 + 然而，可以使用某些类似的 方法： 我们可以取八 

二尤-:，或者可以通过从大约中间处而不是在极左端处抽取数字来从选择 j 。 
这些建议中没有一个将产生类似于算法 B 那样的周期增长。（然而，习题27表明， 
算法 B 不必增加周期长度。） 


6. 例如，如果 ^■，则 + 〗= 2 X „ 0 

7 . [ W . Mantel y Nieuw Archief voor Wiskunde (2) 1 (1897)，172 〜 184。. 

00---01 00--01 

00 ". 10 00 … 10 


X 值子序列： … 变成 

10…00 


10…00 


CONTENTS ( A ) 00"-00 

CONTENTS ( A ) 

8.如同在定理 3.2.1.2 A 的证明中那样，我们可以假设 X G = 0 ，m =，。 首先假 

定这个序列有周期长度由此得出这个序列的周期模/有长度 〆 ， l </< h 否 
则模 〆 的某些余数将不会出现。显然， C 不是 p 的倍数，否则每个都将是 p 的 

倍数。如果 p <3, 则通过反复试验，容易确定条件山）和 IV) 的必要性，所以我们可 
以假定 p >5 0 如果 ^^0 (modulo p )， 则对于某些整 数〜和 Q 及对所有整数1， 

dx 1 + ax + c = d(x + a : ) 2 + c T (modulo p e ) ; 这个二次式在点工和 - 工 - 2 a 〗 取相同 

的值，所以它不可能取模，的所有值。因此 ^=0 (modulo p ); 而且如果 a 异1，则对 
某个： r 我们将有办 2 + < 2 工十 (modulo >)，这与这个序列模有周期长度夕的 

事实矛盾。 

为证明 这个条件的充分性，由定理 3.2.1 ， 2A 和某些平凡情况的考虑，我们可以 
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题答案 


假定 m 二，，其中 e >2。 如果/> = 2,则通过试验我 们有尤 +2 三乂„+2 (modulo 4 )； 
而如果 /? = 3，使用 i ) 和 ii ) ， 我们有 X ;J +3 = X ；J - d + 3 c (modulo 9)。对于 可 

以证明 + X fl + pc (modulo p 2 ) :令 d 二 pr ， a = i + ps o 于 是如果 尤三 ctz + 
pY n (modulo p 2 ) ， 我们必定有 Y >t + i = n 2 c 2 r + ncs + ( modulo /?); 因此， Y „ = 



c l r + cs ) (modulo p ) o 于是， Yp mod p = 0,而且证明了所要求的 


关系。 

现在我们可以证明，对于某些满足 i mod 的〖，以及对于所有的/>1，“提 
示”中定义的整数序列〈；0满足关系式 

X n + j / = X n + modulo p J + l ) , n ^ 0 

这只要证明序列 mod /〉有周期长度〆就足够了，因为周期的长度是，的因 

子而不是的因子。上边的关系式对于/=1已经建立，而对于/>1，可以用下 
列方式通过归纳法证 明：设 

X n + / = + tp f + zy +1 (modulo 〆十 2 ) 

则用于生成这个序列的二次律，连同 d = pr , a = 1 +外一起，产生 Z„ + 1 =2r^ + 


st + Z„ (modulo />)。由此得出 Z n + p = Z n (modulo p ); 因此对于 6 =1,2,3,…， 

X„ + k / = X n + k { tp f + Z,// +I )(modulo p f+2 ) 

置々=/>就完成了证明。 

注 ：如果 /U) 是次数高于2的多项式，而且 X„ + l = /(X n )， 则分析将更复杂， 

尽管我们可以使用 f(m + p k ) = f ( m ) + p k f ( m ) + p 2k f ( w )/2 ! + …的事实来证 
明许多多项式递推式给出极大周期。例如， Coveyou 已经证明，如果/(0)为奇数，对 
于 /(i+!)=/(；) + K modulo 4)，则周期是 

m = 2 e [Studies in Applied Math . 3 (Philadelphia： SIAM ， 1969) ， 70 〜 111]。 

9 .设 X„ = 4 y„ +2; 则序列 满足二次递推式 Y„ + 1 = (4Y 2 , + 5Y, + l)mod 

2 e - 2 

o 

10 •情况 lrXo ^O^! = 1; 因此&三 F „。 我们探求使得 F , 三 0 及 F n + l ^l 

(modulo 20的最小的因为 + 山 F 2 „ + 1 = 朽十 + 我们对 

e 用归纳法发现，对于 e>l，F 3 . 2 r^0 和 F 3 . 2 - 1 + 1 =2 e + 1(modulo 2^ 1 ) 。这意味 

着周期是的因子，但不是3*2〃 2 的因子，所以它或者是 32 P 1 ， 或者是 f 1 。 
但 PVAg、 是奇数（因为仅仅 F 3rJ 是偶数）。 


情况2 : X 0 = a ，X [ = 6，则 X ，,三 a 一丨十；我们需要找出满足 a ( +丄_匕 ） 

十 bF^Eci 及 aF n + bF 71 + 1 三6的最小正数”。这意味着- a 2 )F n ^0，（b 2 - 
以-:)(圮 + 1 -1)^0。且 6 2 - M -? 是奇数（即与 m 互素），所以这个条件等价 


于 F„=0,F ；i + l = l o 

确定对于任意模，的周期的一些方法见 D.D. Wall 的文章， AiVTM67(l%0) ， 
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3.2.2 小节 

- — . . 丨 . . . ’~ 

525 〜 532。关于斐波那契序列模 Z 进一步的事实已由 B . Jansson 作了推导 

[Random Number Gen era tors (Stockholm ： Almqvist & Wiksell , 1966) , Section 3 C 1 ] 0 

11. a ) 对于某个 w ( z ) 和。（之），其中 v ( z )^0( modulo p )， 我们有 z A = 

l + / U ) wU ) +， r (2：)。 由二项式定理可知 

z xp = 1 + p e + l v(z) + p 2e + l v( z) 2 ( p — 1)/2 

加上同余于零 （modulo /( z ) 和 〆 + 2 )的另 一 些项。由于/〉2,我们有=1 + 

p e + 1 • v(z)( modulo /( 2 ： ) 和 〆 + 2 ) 。 如果 〆 + 1 r( 2 ：) 三 0 (modulo /( z ) 和 〆 + 2 ) ， 则必 
存在多项式 a ( z ) 和石（之），使得 p e+l (v(z) + pa(z)) = f(z)b(z) 0 因为/⑻=1， 

这意味着 b(z)M ， + 1 的倍数（由高斯引理 4.6.1 G ); 因此 ^(^)^0( modulo /⑺和 
p) ，矛盾。 

b ) 如果 y - 1 = /( z ) w (2) + p e v ( 2 ： ) , jny 

G(z) = u(z)l (z x - 1) + p e v (z)l f(z){z x - 1) 

因此对于很大的 n ,A n + x = A n ( modulo p e ) 0 反之，如果 〈 A „〉 有后 一 性质，则对于某 

整系数多项式 w ( z ) 和 r (幻以及某个整系数幂级数 HU ) 有 G(z) = u(z) + v(z)l 
( 1 - Z A ) + p e H (z)o 这意味着有恒等式 1 - 2 ： A = u(z)f(z)(l - Z X ) + v(z)f(z) + 

p € H ( z)f( z){ \ ~ Z A ); 而且]^(2)/(：2：)(1 _ )是 一 个多项式，因为等式的其它项都 

是多项式。 

c) 我们只需证明由 A (/)^ A(y + i ) 可推出 A (/ + 1 ) = M (/)^ A (/ + 2 ) 就够 

了。应用 a ) 和 b )， 我们知道 A (/ + 2 ) 乒科（，），而且 A (/ + 1 ) 是 〆 （ 〆 ）的因子，但 
不是 A (/) 的因子。因此，如果 A (，）= // g ， 其中 g mod p 乒0,则 A (， + 1 ) 必然是 

/+~，其中 d 是 g 的—个因子。但现在 X ； + /-^ X n ( modulo /); 因此/ +1 d 是 
i/q 的倍数，因此 d 二 q 。 [注 ：假设 p e >2 是必 需的； 例如，设 a x =4 y a 2 = ~l,k=2; 

贝 |J 〈 A„> = 1 ， 4 ， 15,56,209,780 ， ".;A(2) = 2 ， A(4) = 4 ， A(8) = 4。] 

d) g ( z) = X Q + (X { ~ qX。）z + … + (X k - { - a x X k - 2 - a 2 X h — 3 ——.—— 

e ) 可以把 b ) 中的推导推广成为 G ( z ) = gU )//( z ) 的情况，则周期长度 A 的假 

定意味着 g(z)(l~ z x ) E 0( modulo /( 之）和 p e ) a 我们仅仅讨论上面 g(z) = 1的特 
殊情况。但这同余式的两边可乘以 Hensel 的6 ( 2 ： ) ，而且我们得到1 _ = 0 

(modulo /( 之 ） 和 p e ) 0 

注 ：无须 使用生成函数，而使用类似于习题8答案中的那些方法，可以给出 c ) 中 
的结果的更为“初等”的证 明：如 果对于 n = r，r + l ， …， r + 々_ l 及某些整数 

A a + w + p e B n ，则若通过给定的递推关系来定义 J 3 r + / ^ ， + 1 ，… ，那么对于所 

有，这同一关系成立。由于得到的 B 序列是 A 序列移位的某些线性组合，我 
们将有，对于所有足够大的 n iM.,B x + n =B n (modu\o p e ) Q 现在义（/ + 1 )必然是；1 = 

义（ ^) 的某个倍数；对于所有充分大的 72 ，对于 7=1 ， 2. ， 3 ， *" ，我们有焱 „~,= 八 72 +， 

(艮十 + A 十氏 +2 A 十…十 B „ + ( r 1) A ) EA „ 十分見 （modulo p 2e )o 没有々个连续的 
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习题答案 


b 是的 倍数； 因此当时可直接得出 x ( p e+l ) = px ( P n ^ Hp e +2 ) o 我们还必 

须证明，当 f 是奇数和 e = 1时， A (/ + 2 ) 参如（/)。这里我们假设 B x + n = B n + 
pc n ，并注意当 n 足够大时 C n + X = C n (modulo p ) Q 于是 A n + p = A n + p 2 

+ (^) c n )(modulo p 3 )， 因而这个证明可容易地完成。 

关于这个问题的历史，见 Morgan Ward ，了 Vans . Amer . Math . Soc . 35 (1933),600 
〜 628; 也见 D . W . Robinson,AMM 73 (1966)，619 〜 621。 

12 .周期长度模 2 顶多是 4; 而由上题的考虑周期长度模 2 e + 1 顶多是极大长度 

模 Y 的两倍。所以极大的可以想像的周期长度是 2 e + 1 ; 这是可以达到的，比如说， 
在 a =0 ,b = c = 1 的平凡情况下。 

13，14.显然，么 + ；1 = 2„，所以肯定是 A 的一个因子。设 A /和；^ 的最小公倍 
数是 A ;， 并类似地定义 A ;， 我们有尤+ Y ^ Z ^ Z , + A ； ^ X „+ Y „ + A 卜所以彳；是 A 2 

的倍数。类似地，是 At 的倍数。这就得出了所求的结果（在能构造 A / zAa 的序 

列以及构造 A ^ A 的序列这一意义下，这个结果是“最好的”）。 

15. 对所有充分大的72，算法 M 在步骤 Ml 生成 + h ,并在步骤 M 3 输出 

Z n = X n + k _ q 。 于是〈义>有长度为 A ' 的周期，其中 A ' 是对于所有很大的72,使得 

H rt 

X n + k - q = X n + y + k _ Q 的最小正整数。由于 A 是；^和 A 2 的倍数，由此得出 A /是 

n ^ A ， 

A 的一个因子（这些发现来自 Alon G . Waterman) 0 

对所有很大的？1，由诸 X 的不同性我们也有打+々 - 〜三72 +义 / +々-9 71 + ；1 ， 

(modulo Ajo 〈〜〉的界意味着对所有很大的 n ，％ + ;/ =〜+ c ，其中 c = A ' (modulo 

Ai^lcl 但由于〈<?„〉有界， c 必须为0。因此 A '=0( modulo Aj ，而且对于 

所有很大的 n，i + A , = % ; 由此得出，义/是义 2 和的倍数，所以 A^Ao 

注 ：习题 3.2.1.2-4 的答案意味着当 〈A >是极大周期模 m = l e 的一个线性同 

余序列，且 々是 2的幂时，周期长度 A 2 将至多是2^ 2 。 

16. 有好几个证明方法。 

(1) 利用有限域理论。在具有公个元素的域中设 f 满足# =幻# _1 +…+以。 

设/(&#」+…+ = ~，其中每一个 匕是 0或者是1;这是一个线性函数。在执 
行 (10) 之前如果在生成算法中字 X 是 （602 …~ )2,而且如果幻# 1+ …+ = 

r ， 则在执行 do ) 之后字 x 表示 n 因此这个序列是 /( r ),/( r + l ),/( r +2 ), 

…;且 /( 广）= /( 州=/(以”+ ㈠ +…+ ^二〜八广’ +…+以⑻。 

(2) 利用硬算，或者初等的技巧。我们得到一个序列满足 

x (n + 1); - = x n(j + l) + a } x n !, 1 < ; < k ; X (n + l)k = a ^ X wl (modulo 2) 

我们必须证明，这意味着对+…+其实，它意味 
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3.2.2 小节 


着当时， X nj = a 1 X( n ^Dj +…十 a k X 、 n _ 对于 j = l ，这是显然的，因 

为 X nl 三 qXu — w + Xh — 1 ) 2 三勾又 (7? — in 十 a 2 x ( „- 2)1 + x (77 — 2)3 , 等等。对于7〉 


，通过归纳法我们有 


X nj 




X 


( 72 + 1 ) ( ； - 1 ) 


a ■ 一 j 




(77+1 — i)(J—l) 


- a ： 




(n - i)i 


\^ i<k 


l ^ i^k 


2 a i^ X (n + \-i)( } ^\) ~ a j-l X (n-01 ) 三 + …十 a k X (n - k)j 

这个证明不与这些操作是在模2,还是在模任何素数下进行的有关。 

17.( a ) 当这个序列终止时， 々- I 元组 U n + 1 ，…，尤+ ^)第 m + 1 次出现。一 

个给定的 A - 1元组 （ X r + 1 ，…， 尤+卜！）仅能有 m 个不同的前驱 X r ，所以这些出现 

之一必定是对于 r = 0 的。 （b) 由于々 -1 元组（0,…， 0) 出现 m + 1次，因此每个可 
能的前驱都岀现，所以对于所有 a ly 0< a { < m , k 元组，0，…， 0) 出现。设1< 5 

< k 并假定我们已经证明当〜关0时，所有々元组（〜 ，…，〜， 0, …， 0) 出现于这个序 

列中。由构造方法可知，这个^元组将不出现于这序列中，除非对于 l<y< m， 
(q ，…，，()，.••，0, 3O 早先已经出现了。因此 A - 1元组（〜，…，\，0,…，0)已经出 

现 m 次，而且所有 m 个可能的前驱都出现；这意味着对于 ，…， 


~，0，"*，0)出现。由归纳法，现在完成了证明。 

利用习题 2.3.4.2-23 的有向图，这个结果也可以从定理 2.3.4.2D 得出； 由 

(A ，… ，七， 0，".，0)到（工 2 ，."，勺，0,0，".，0)的有向边的集合（其中 a 关0且 1 <j 

<々），形成同杜威十进记数法巧妙地相关的一个有向子树。 

18. 由习题 16，LT„ + 1 的最高有效位完全由 R 的头一位和第三位确定，所以64 

个可能的数偶 + 32个出现。（注 ：如 果我们用的是，比如说，11 

位数 L/„ = ，则这个序列对于许多应用来说就会令人满意 

了。如果出现于 A 中的另一个常数有更多的“1”的位，则广义谱检验也许会给出关 
于它的适当性的某个指示。见习题 3.3.4-24; 我们可以在维数 r = 36,37,38,…下， 

考察 V t o 

21 . \ J . London Math . Soc . 21 (1946) ， 169 〜172。 ] 像习题 7 中那样，在适当位置 

插入0,将使任何没有 A 个连续的0的周期长度为 - 1的序列，变成一个周期长 
度 m k 的 序列； 反之，我们可以从周期长度为的一个序列开始，由这个周期删去 
适当的0,以形成其它类型的序列。我们称这些为类型 A 和 B 的“ （mj) 序列”。对 
于所有的素数 P 和所有6>1，这些假设使我们确信（/>，々）序列的存在性；因此对于 

所有这样的 f 和々，我们有类型 B 的 （> j) 序列。 

为得到类型 B 的一个（〆，々）序列，设 e=gr， 其中 q 龟 p 的幂而 r 不是 f 的倍 

数。由类型 A 的一个 （p，#) 序列即乂心^心…开始旧后⑽用》进数系统) 

分组的数字（X。，…， X g —— ，…形成类型 A 的一个 （p g ，r々） 序列， 
因为 g 与/ >^-1 互素，这个序列有 p—-1 的周期长度。这就导致了类型 B 的一个 
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(/^，^^序列以上而且通过类似的论证，^^：^…、—】）/，^!^!…！^-!)/， 

…是类型 B 的序列，因为 r 与 pH 

为得到对于任意 m 的类型 B 的 （ m ，々） 序列，利用中国剩余定理，对于 m 的每 
个素数幂的因子，我们可以把（，，幻序列结合在一起。但是还可利用一个更简单的 
方法。设 〈 XJ 是类型 B 的 （ r ， A ) 序列，〈是类型 B 的（ 5 j ) 序列，其中 r 与 s 互 

素，则〈 （ 尤+ I ) mod rs 〉 是类型 B 的 （ rs ， A ) 序列。 

A . Lempel 发现了对于 任意々 产生出 （2 ，々）序列的一个简单一致的构造方法 
[IEEE Trans . 019 (1970) ，1204〜 1209] 。 

22 . 由中国剩余定理，我们可以求出常数，…，七，它们模772的每个素因子后，即 

是我们所想要的余数。如果772 == PW " A ，则周期长度将是 icm ( M - 1 ，…， g - 1)。 

事实上，如习题11所示，对于任意 m (不必是无平方的），我们可以达到相当长的周期。 

23. 减法可能比加法更快，参见习题 3.2. 1.1-5。由习题30,周期长度仍然是 

Y ^ U 55 - 1)。 R . Brent 已经指出，这些计算可精确地对 [0 ， 1) 中的浮点数 进行； 参 
见习题3 .6 - 11。 

24. 向后运行这个序列。换句话说，如果乙= Y - w 我们有= ( Z n - k , L - 

Z n - k ) mod 2= ( Z n - k + L -^ Z n - k ) mod 2 。 

25 . 这个想法可以节省子程序调用的大部分开销。例如，假设通过 JMPRANDM 来 
调用程序 A ， 其中我们有 


RANDM STJ 1 F 

LDA Y ,6] 


•: 卜程序 A 

ENT 6 55, 


1 H JMP * 


每个随机数的开销因而是14+ _个时间单位。但假设我们代而使用，比如说 “ DEC 6 
1; J 6 Z RNGEN ; LDA V ，6”来生成随机数，且子程序 如下： 


RNGEN STJ IF 

ENT 6 24 
LDA Y + 31,6 
ADD Y ，6 
STA Y + 31,6 
DEC 6 1 


ENT 6 31 
LDA Y ， 6 
ADD Y + 24,6 
STA Y ， 6 
DEC 6 1 
J 6 P * —4 


J 6 P 卜 4 ENT 6 55 

1 H JMP * I 

现在开销仅是 (12 + 以 C 语言表达的一个类似的实现，被用于 ： The Stanford 

GraphBase ( New York : ACM Press ,1994) , CB _ FLIP 中。]其实，许多应用发现一次 
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3.2.2 小节 


就生成随机数的一个数组是可取的，而且，当我们使用的方法增强随机性 
后，后一方法实质上是强制 性的； 参见 3 . 6 节中的 C 和 FORT 只 AN 程序。 

27.设人=」。引理 :在 U 2 + 7是- 2)/2 个连续的值 

0 k + 2 1 0々 + i 2 0々… (^-1) 0 3 

出现于 （ J „) 序列中之后，对于< k ，算法 B 将有 V [ j ]< ml k 函 K 还有 Y < mlk 。 

证明：设 S „ 是使得在刚好生成之前 V[j ]< mlk 的位置 7 的集合，并设^是使 

得 V [九] — X „ 的下标。如果九且九=0,则 \ + 1 二 SmUUJ 且 h + 1 >0; 如果 
九且人=0,则 S , + 1 = S ,,^ + 1 =0 o 因此在 A +2个相继的0之后，我们必定 
有和^ + 1 =0。然后，在“1 0+ + 1 ”之后必定有|0，1丨 GS 77 而且九 + 1 =0;在“2 

0 A ” 之后我们必定有 iO ， l ， 2 | GS „ 和 九 + 1 = 0 ;等等。 

推论•.令 I = ( k 2 + 7 k - 2)12,如果入> lk l ， 则或者算法 B 产生长度为 A 的周期， 
或者序列 （ X „) 很差地分布。 证明： J 的任何给定长度/的模式不出现在长度 A 的一 

个随机序列中的概率小于 （1 -々 _/ ) A // < exp (- 々 _/ A / Z )< e _1 ; 因此所述模式将出 
现。在它出现之后，算法 B 随继的特性在每次它达到周期的这部分时将是相同的。 
(当 k >4 时，我们要求 A > 10 21 ， 所以这个结果纯粹是学术性的，但较小的界是可能 

的 。) 

29. 下列算法在最坏情况下执行大约 P 个操作，但它的平均运行时间要快得 
多，或许是 0 ( log 々）或甚至 0 ( 1 ): 

XI •置（判，勾，… , a k , x k ,m - 1 )。 

X 2 .设 i 是使屮 >0 和 z >0 的极小值。当 a k >0 时，对于 j=j + 1，…，々，执行子 

程序 Y 。 

X 3 •如果〜，则 /( :^，…，& ) = a 。 ；否则如果〜 > 0,则 /( :^，…，:^ ) = 

a 0 _ 1，否则 /( :r i ，…， a ) =〜。 I 

Y 1. 置 Z —0。 （在步骤 Y 1 ~ Y 3 中的子程序实质上是检验字典序关系（< 2 2 ,…， 

A + …，七，如果必要时 减少〜 使这个不等式成立。我们 

假定 < 2 / ^ + 1 = < 21 ，< 2 / ^+2 = “ 2 ,等等。） 

Y 2 .如果七 + / >七 + / ，则退出这个子程序。否则如果 J 十/ =々，则置 a k — a i + l0 

否则如果 a l + i = a J + I ，则转到步骤 Y 3。 否则如果 j + Z >々，贝 U q 减1并退 

出。否则置以―0并退出。 

Y 3. Z 加 1 ,而且如果 l < k 则返回步骤 Y2 。 | 

当 772 = 2时这个问题首先是由 H . Fredricksen 解决的 [/. Combinatorial Theory 9 

(1970)，1〜5; A 12 (1972)，153〜 154]; 在特殊情况下，这个算法较为简单而且它可 
以通过々个二进位的寄存器来进行。也可参见 H . Fredricksen 和 J . Maiorana , Dis ¬ 
crete Math . 23 (1978) ，207〜210。 

30. a ) 由习题11，只须证明周期长度模8是4(2& - 1); 这将为真当且仅当 
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题答案 


舍 1 (modulo 8和 f ( x ))， 当且仅当 


- 1 


吴 1( modulo 4和 /( 


写 /( 


X 


f 人 


X 



xf 0 ( x 2 ) ，其中 f e (x 


2 


( fix ) + /( - ^：)) o 于是 /( X ) 2 + /( - 1 ) 


2 /( 


X 


2 


)(modulo 8) 当且仅当 f e (x 



ocfo ( x ) 


f ( x ) (modulo 4); 而且后一条件成 


立当且仅当 /；( 

f { x ) + 0( x kl 


' =- xf 0 (x ) 2 (modulo 4和 /(: c ))， 因为 f e (: 
而且，对模2和 / U ) 进行工作，我们有 /；( 



工 fo ( 

三 f 乂 


X 


X 


工 fo( 


X 


X 


人 U ) 2 , 因此 


务一 1 


X 


fo ( 


X 


和 f ( x )), 得到提不。 


个类似的论述证明 


o 


k 


所以 fe ( x ) 


X 2 f 0 (x) 


(modulo 4 


x 


x (modulo 4 和 /(: c )) ，当且仅当 


/( 工） 



/( _ 工） 


2 (- 1 ) 


. /(- x 2 ) (modulo 8) 0 

2 Z •时，这个条件才能 J 


b ) 仅当 Z 是奇数和々 = 2/ 时 ，这个条件才 
模2本原的 [ Math . Comp . 63 (1994) ，389〜401 




2时 /( x ) 才是 


0 


31.对于某些八 和；， 通过应用定理 3 J .1.2 C ， 我们有 X „ 


— 1) Y ” 


Zn 


mod 


2 e ; 因此 = ( y „-24 + ^ 
是奇数当且仅当& mod 8 


-55 


+ z 


55 ) mod 2 和 Z „ = ( Z „ — 24 + - 

3 或5,由上题周期长度是 


n - 55 


mod 2 


-2 


由于 z 


-3 


(2 55 -l)o 


32 .我们可以忽略 “mod m ” 而在以后再把它放回来。生成函数 gU 




是 1/( 1 — 2： 


24 


Z 55 ) 的多项式倍数；因此 




2 




z 



g( - 2：)) 是可由 （1 — 


2： 


24 


Z 


55 \ /I _ 24丄 .55 


)( 1 - 


Z 


Z 




l -2 z 24 + ^ 8 - z 11 G 整除的多项式。因此头一个要求的 


递推是 X 2r? 


(2 X 2(^ - 12) _ X 2 ( n - 


24) 


+ X 


2 U -55) 


mod m 


类似地， s , x 3 户 



(g (z) + g (ojz) + g(OJ 2 Z ))， 其中 


CO 


e 2 W 3 , 因此我们求得 X 


( 3 X 3(„ -8) 


3又 3( 7? — 16) + 又3( 7? - 24) + ^3( n 


55) 


)mod 


m 


33.( a ) 由对〖作数学归纳法 ，有仏 


( z ) 


t 




)(modulo 


m 


和 1 



z 


31 


2： 


55 


) 


( b ) 由于 


mod (1 


% 


31 


Z 


55 


364 z 16 

120 之 43 


z 16 + 210 z 19 


105z 23 


462 


16 


792 

30 丄 



% 



17 



^ 30 + 1287 之 33 


KJ 

Z 十 
9 之 36 


715 z 9 + 36^ 12 + ^ 13 

+ 18之 37 + 1001 z 40 





之 44 + 455之 47 + 462, + 120/ 4 ( 参见算法 4.6.1 D ) ，我们有 X 500 = (792 X 2 


+ X5 + •• •十 I2OX54 ) mod m 

[比较类似的公式 x 165 = 


(X 



3X7 + X 14 + 3 X 31 +4 X 38 + X 


45 


mod 


m 


和上题 


中关于 〈 X 3 „> 更稀疏的递推是有趣的。 Liischer 的生成165个数和仅使用头55个数 


的方法显然优越于生成165个数和仅使用 X 3 , X 6 , 




，X 


165 


的想法。] 


34 •令 g 0 


0 ，gi 


q n ^ l ~ cq n + aq n -\ 。然后我们有 


0 


a 


^Qn - 1 Qn 

^Qn Qn + 


X n = ( q n + 1 X 0 + aq n ) l ( q n X Q + «〜 — ！）， 而且对于 n ^ l y x n mod f { x ) = q n x + aq n - xo 


因此如果 Xo 


0,我们有 


0 当且仅当 X ” mod /( I )是一个非零常数。 
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3.3.1 小节 

^^_____—^—^ ^ 

35. 条件⑴和 (n) 意味着 /(x) 是不可约的。因为如果 fix ) ^( x ~ r x ){ x - r 2 ) 且 

厂 i r 2 # 0 , 我们有：如果 r : 7 ^ r 2 , W \ / — 1 三 1 ，而如果 n = r 2 , 则/三厂 1 。 

令6是有 p 2 个元素的一个域的原根，且设 f k 二心 我们所求的二次多项 
式即是多项式力（：0 = ：^-¥-々，其中 l<々<f 2 -l 且々丄 P + 1 (参见习题 

4.6.2-16)。每个多项式对于两个々值 出现； 因此解的个数是 |( p 2 - l ) n (? \ p + 1 ， q 素数 

(1 - l/g) 。 

36. 在这种情况下，\总是为奇数，所以 X^mod 2 e 存在。在答案34中定义的 
序列〈〜>是0，1，2，1，0，1，2，1，…模4。我们也有= A(W + i +叫 ” -i) 和 92,-1 = 

- 1 + <7$ ;因此 0.2 n + \ ~ 2 ti ~ \ ~ ^ Qn + \ ~ a Qn - l)^9« + l a Qn + 1 ) o 由于当72是偶 
数时，〜+ 1 +叫„ + 1三2 (modulo 4) ，我们导出，对于所有的 e>0, gy 是 f 的奇数倍， 

而+1 _ 叫 2 f - 1是 Y + 1 的奇数倍。因此 

<?2 £ 十 a Qi e -\ ^ 92 ? +1 十 a<72 e 十 2 e+ (modulo 2 e ) 

而且 Xy- 2 三（％- 2+1 + aq 2 e - 2 ) l ( q r -2 + aq 2 e-2 ^)^1 (modulo 2 e ) ，同时 X 2 ^^ l 0 

反之，我们需要 a mod 4 = 1 和 c mod 4 = 2; 否贝 !j X2” = 1 (modulo 8) 。 [ Eichenauer, 

Lehn 和 Topuzoglu , Math . Comp . 51 (1988)，757 〜 759。] 这个序列的低阶一>进位有一^ 

个短的周期，所以带有素模数的反演生成程序是可取的。 

37. 我们可以假定心=0。由习题34, V中的一个典型的向量是 

(x , ( 5 2 x + as 2 ) l ( s 2 x + aA) ，…， ( 5# 十 as d )1 ( s d x + as d )) 

其中〜 =%，< = q b +\ ys ] = q b ,-\ o 这个向量属于超平面 H 当且仅当 



+ 






X 


Ud 


厂 0 


r 2 s 2 s 2 


-1 


(modulo p) 


其中 ~ = a - a 5»； 2 = -( - a ) V 2 和〜 = CIS jS j l o 但是这个关系等价于次数小于 

等于 d 的多项式 同余； 所以对于 ： r 的 d + 1个值它不能成立，除非对于所有的工，包 
括不同的点 X = W 2 ，…，1 =〜，它都成立。因此「2二…=三0，而且0=0。[参见 


I . Eichenauer-Herrmann , Math. Comp. 56 ( 1991 ) ,297 




301 


如果我们考虑有行 Ui ， 


V ^) ( Va 


春 ■ 


e vi 的 （/> 


1) 矩阵 M ， 这道习题等价于断言， M 的任何^ + 1行在模 P 之下线性无关，有趣的 
是对于〜1000和 0« p 画出点 （ X „， X „ + 1 ) ，看到的是圆圈而不是直线。 


3 . 3.1 小节 

1 .有是= 


11 个范畴，所以应使用行^ = I 0 o 


2 . 


2 


3 


4 


5 


6 


9 


6 


5 


4 


3 


2 


而 ’ 石， 49 ， 49 ， 49 ， 49 ， 49 ， 49 ， 49 ， 49，49 
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习题答案 


3. V = 7^， 仅仅稍微高于由好骰子得到的！为什么我们不检测加重，有两个 

原因： （ a ) 新的概率（参考习题 2) 并不真正远离等式 （1) 中旧的概率。两个骰子之和 
使概率趋于平滑。如果考虑的是36个可能对偶值的每一对，并加以计值，则我们大 
概很快地就会发现这一差别（假定两个骰子是可以区别的）。 （ b ) —个更重要的原 
因是，对于发现重大差别说来， n 太小了，如果同样的实验对充分大的”进行，就将 
发现有差错的骰子(见习题12)。 

4•对于 2< s <12 和5尹7，久=&，/? 7 = +。 V 的值是16 士，它落入表1中 

7596和95%的项 之间； 所以尽管实际上并没有太多的7出现，但它是合理的。 

5 . K 2 + 0 = 1.15,1^20 = 0.215。这些同随机特性相差不太大（大约处于9496和 

86%的水平），但它们非常接近（这个习题的数据值由附录 A 表1得出。） 

6. X ; < x 的概率是 F ( x )， 所以我们有在 1.2.10 小节中讨论的二项式 分布: 

F n ( x ) = sin 具有概率 


n ) F ( x) s (l - F ( x ) r~ s 

\ s / 

均值是 FU ); 标准差是 VFU )( l - FU ))/ n 。 [参考等式 1. 2.10-(19)。这提示， 
较好的方法是把统计公式定义为 

K : = \Hn max ( F n ( x ) - F ( x))l VF ( x)(l - F ( x )) 

— OO 〈 X 〈 00 

见习题22。对于 工 < y , 我们可以计算 F n ( y )- 匕 （ 2 ) 的平均值和标准差，并且得到 

(: r ) 和的协方差。利用这些事实，可以证明，对于很大的”值， 函数匕 U ) 

的特性像“布朗运动”那样，而且取自这个概率论分支的技术可以用来研究它。 J . L . 
Doob 和 M . D . Donsker 的论文说明了这一情况，见 Armais Math . Stat . 20 (1949) ,393 

〜403和23 (1952),277 〜281;—般认为这是研究 KS 检验最明智的方法。] 

7. 在等式 （13) 中置即知绝不为负，而且它能达到 vG 那么高。类似 
地，取 j -1 来对作同样的观察。 

8. 对20次观察计算了新的 KS 统计量。当计算统计量 KS 时，的分布用作 
F ( x )。 

9. 这个思想是错误的，因为所有的观察都必须是独立的。对于相同数据，统计 
量 K ；： 和之间有一个关系，所以每个检验应当独立地判定。（一个检验的高数 

值势必使另一个检验有低的值。）类似地，图2和图5中的项（它对于每个生成程序 
示出15个检验）并不给出15个独立的观察，因为5的极大值检验并非同4的极大 
值检验无关。每一水平行的三种检验是独立的（因为它们是对这个序列的不同部分 
进行的），但在一列中的5个检验是有一定关系的。其纯效果是：对于一个检验适用 
的95%的概率水平不能想当然地适用于相同数据的整组检验。教训 ：当检 验一个 
随机数生成程序时，我们可以预期它“通过”好几个检验的每一个，例如，频率检验， 
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极大检验，运行检验， 等等; 但是由若干不同的检验得到的数据数组不应该当成是一 
个单位，因为这些检验本身可能是不独立的。和统计应该认为是两个单独 

的 检验； 一个好的随机数来源将通过两个检验。 

10. 每个是双重的，而且 nA 是双重的，所以 （6) 的分子是四重的，虽然分母 

仅仅是双重的。因此 V 的新值恰是旧值的两倍。 

11. 经验分布函数保持 相同； 和 K ；： 乘以々。 


12 •设 Z 5 = ( y 5 — nq s ) ly / nq s 。 V 的值是 t ? 乘 

k 

X (仏一 A + y qj nZ s ) 2 l p s 

J = 1 

而且当 72 增加时，后一个量保持非零有界（因为乙〃_ 1/4 有界的概率为1)。因此在 

Ps 的假定下， V 的值将增加到一个极不可能的值。 

对于 KS 检验，设 F ( j ：) 是假设的分布， G (： c ) 是实际的分布，并设 A 二 
max | G (: c ) _ F (: c )|。 取 rz 充分大，使得 | F „ (: r ) _ G ( x ) | > hjl 以非常小的概率 

岀现； 于是1匕（工）-尸(：01在假定的分布 FU ) 之下将高达一个极不可能的值。 


13.( 由于我们所指的是最小的上界，所以 “ max ” 的符号实际上应以 “ sup ” 来代 
替; 但是为避免很多读者由于不大熟悉 “ sup ” 符号而产生混乱，正文中便使用了 
“ max ”。） 为方便起见，设 X 0 - - X „ + 1 = +⑺。当: r < & +!时，我们有 

FAx)=jln; 因此 - F(x)) = j/n - F ( X, ) ,而且在这个区间中 


max ( F ( x ) _ F ”（ x )) = F ( X J + '、 _ jin 。 当 j ■从 0 变到 w 曰寸 
虑了； 这就证明了 


的所有实值都被考 


K ； = 


max 


n 




K 


sn 


max 


F ( X ,) 



这些等式等价于（ 13 )，因为在极大符号下的额外项是非正的，而且由习题 7 它必定 
是多余的。 

14.左边的对数简化为 




1 - k 




2 


ln (2 


nn 


) 一 




2 


S ln ^ 


5 



而这个量进一步简化（通过展开 hi(l + 乙 //&) 并知 M =1 Z , =0) 成 




ln ( p ^- pk ) + O 




15.( i ) 从行列式消去因子用包含 “cos 6 X - sin 心 0 … 0” 的行的诸余子 
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题答案 


式（每个余子式行列式都可用归纳法加以计算）展开得到的行列式，以及（出）利用 


sin 




cos 



，不难计算出对应的雅可比行列式。 



16. 


exp 


u 




2x 


+ 


■ m 


du 


: ye 


+ O 





+ 


exp 


u 




2x 


+ … \du 


后 一 积分是 



e _ w /2 dw 十 





3 x 


e 


u & 十 O 






当把它们全都放在一起时，最后的结果是 

y(x + \ ^ x + z \/ 2x + 


2Ta/2 


u /2 


r( 


X 



l ) 


du 



丌 


2 




2 2 


KX 




Z 


十 o 


X 


如果我们置2：^ = ：^，并令 


72 


w l2 du 


P , 


X 



丌 


2 ， 


7 




2 ^ 2 


r 


2 


P 


其中 "2 


X 



z 


X 


+ 3 S 我们可以对 y 求解并得到^ 


2 





(1 + 


2： 



0(1//^)， 它 


同上边的分析是 一 致的。因此解是, = 1^ + 2 a/^2 ： +冬2： 2_ 善+0( l / v^V ) o 


17. a ) 换变量，: c ， 


X 



b ) 对 n 用归 纳法； 由定义， 


- ^ 




DO 


(x n - t )dx w 


c ) 左边是 


dx 


k + 2 


走 + 1 


dx ⑷乘 dx k 



d jc 灸一 i 


dx 


d ) 从 b ) 与 c ) 我们有 


k 


Pnk (^) 


E 


( r - 0 


X 



十艺一 r：T 


(n — r)! 


n — r — l 


(: c 十 £ 


n 


(24) 中的分子是 i\ u 」（n 


18 .如同在正文中关于 (24) 的推导中所注释的那样，对于0<工<1我们可以假 


设 FU ) 


X 


如果 


则令 Z , 


1- x„ + 1 _,o 我们有 (XZig 


<乙<1;而且对于 X ,，…，计算的 K ；： 等于对 Zi ，…， Z „ 计算的这个对称 
关系在相等体积的集合之间建立了一对一的对应，对于它们， i ^+ 和都落人一 
个给定的范围中。 
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3.3.2 小节 


20.例如，项 0(1/〃） 是-(告 / _ yP )/ r ? + OU _3/2 )。 H . A.Lauwerier 已经得 

到一个完整的展开， Ze / tschW/t fiir Wahrscheinlichkeitstheorie und verwandte Gebiete 

2 (1963)，6 卜68。 

23 .设 m 是大于等于 n 的任意数。 （ a ) 如果 L mF ( 足 )」= L m _ F ( X ,)」且 i > j , 
则 i/n ~ F ( X t )> jin ~ FiX^o ( b ) 对 0<々< m 以 =1 _ 0 ，〜二 0.0 和 q = 0 开 

始，然后对于每个观察量七做下列操 作：置 Y ^ F ( X ; ) , mY \ y a k ^ mm { a k , 

Y ) ,6^ max (^ , Y)—q + 1。（假设 F ( X 7 )< 1，使得々 < m 。） 然后置 0, r + 
—厂 —0, 而且对6=0，1 ，…， m -1( 按此顺序），每当 c k >0时，做下列操 作：置 r — 

— max ( r _ ， a 々 _ jl n) ， j —j + c k , r + — max ( r + , j/n - b k ) o 最后置 — V ^ r + ’ 

K :—^ pnr -。 所需时间是 0( m 十 《)， 而且不必预先知道 n 的精确值。（如果估计 
值、+ ^- j jm 用做 a 纟和~，使得对于每个々实际上仅仅计算4，我们就得到好到 

^ V ^/ m 之内的 iC 和 K : 的估计，甚至当 m < ?2时亦然 。） [ACM TransU 
Software 3 (1977) ,60〜64。 ] 

25 • a ) 由于 cy = E ( 1 a 以 S/ 2 : 1 ，我们有 C = AA T 0 

b ) 考虑奇异值的分解 A = [ JDV T ， 其中 [/和 V 是大小 m X m 和 72 X ”正交 
的，而 D 是 m x n 的并有元素< = [ i 二 j ] A ;奇异值〜总为正。[例如， Golub 和 

Van Loan , Ma trix Computations (1996)，§2.5.3。] 如果 CCC = C ， 我们有 SBS = S , 
其中 S = DD t M B = U T CUo 因此〜 =[;= j ] 其中我们令〜 + 1 = … = 〜 = 0, 

并令 Sij ~ 2^, iSikbki^ij = 0因此如果，则心 • = [ ^ = j ]/ ，而且我们导出 

D t BD 是 X ” 单位矩阵。令 Y L ) T 和 X = ( Xi , *** , X „ ) T ; 

由此得岀 W = yTCysXTATCAX ^ XTVDTBDV ^ XsXTX 。 

3.3.2 小节 

1. 对于；检验的观察量必须是独立的。在第二个序列中相继的观察量显然是 

相关的，因为一个的第二分量等于下一个的第一分量。 

2. 对于0< ; <77，构造〖元组 （ y 」 z ， …， y ^ + 广！） ，并且计算这当中有多少个等于 

每个可能的值。在每个范畴中以 k = d L 和以1//的概率来应用％ 2 检验，观察的数 
目至少应该是5/。 

3. 通过枚举其余〃 -1 个发生可以出现的可能位置，以及通过计算这样一个模 
式的概率，恰好有7个值被考察的概率，即是位于范围之内的第 

n 个元素的概率，容易看出是 
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题答案 


生成函数是 GU ) 


(於 /( l -( l - f ) z ))' 由于当 


71 


[ 时给定的分布是同一事物 
成 比例； 现在容易发现被考 


1时， 


的 rz 重卷积，因而它是有意义的。因此均值和方差同〃成比例；现在容易发现被考 

察的诸 L 7 的数目有特征 （min ?? , ave n / p , max 00 , dev V n(l~ p)l p ) o 当 n = 1 时， 

这个概率分布的更详细的讨论可以在习题 3.4. 1-17 的答案中 找到； 也可见习题 
2.3.4.2-26 的更一般的结果。 

4.长度大于等于 r 的一个间隔的概率，是 r 个连续的 L 7 位于给定范围之外的 


的一个间隔的概率是长度大于等于 


r 


的概率 


概率，即 （1 - P Y 。 长度精确地等于 r 的一个间隔的概率是长度大于等于 r 的概率 
减去长度大于等于 r + 1 的概率。 

5 .当 JV 趋于无穷时，77也这样（具有概率 1) ，因此除了最后的间隔长度外，这个 
检验恰和正文中介绍的间隔检验一样。而且正文的间隔检验肯定渐近于所述的％ 2 
分布，因为每个间隔的长度显然同其它长度无关。 [注： 这个结果的十分复杂的证明 

是由 E . Bofinger 和 V . J.Bofinger ^Annals. Math. Stat. 32 (1961),524-534 中给出 

的。他们的文章是值得注意的，因为它讨论间隔检验的好多个有趣的变形；例如，他 
们还证明，量 


(1961) 




534中给出 


0^ t 


Y r — ( Np ) p r ) 


( Np ) p r 


不趋于 X 2 分布，尽管由于是〃的期望值，已有人提议把这个统计作为一个“更 
强”的检验。] 


7.5,3,5,6,5,5,4。 

8 .见习题10且有 w = d 。 

9.( 在步骤 C 1 和 C 4 中把 d 改成 w 。） 我们有 


Pr 


d(d — 1) … _ 


W 


+ 1 ) 


d r 


r — 1 
w — 1 


，对于 


U ) 





< 


Pt 


1 - 


d \ 


d L 


-1 


0 ! 


-1 
d 


一 1 




(d — xv ) 


iv 


10 .如同习题 3 中那样，我们实际上仅仅需要考虑 n 


1的情况 


O 


个集券集合 


的长度为 


r 


的概率的生成函数，由前边的习题和等式 1.2. H 28)， 是 


G(z) 


d \ 


(d 


UJ 


)! 


S 

r>0 



-1 


w — 1 


z_ 

d 


~ z 


W 


d - 1 

d — z 


d - w + \ 


d — 


vu 


- 1 ) 


z 


利用定理 1.2.10 A 和习题 3.4.1-17 容易计算均值和方差。我们发现 


mean ( G ) 


XV 



d 

d - 1 


一 1 



+ 


d 

d — w 1 


- 1 


d ( H d 


H 


d - xv 




var ( G ) 

由于对于一 






Hi 2 } 


XV 


- d ( H d - H d - 


VU 


a 


个集券集合的检索被重复 n 次，所考察的诸的个数有特征 （min um ， 


max 00 , dev o ) 

|1|2|9 8 5 3|6| ^ 


0 4 


12 .算法 R (用于运行检验的数据) 
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.3.2 小节 


R 1. [初始化]置 _ 1，并置 C 0 UNT [1]— C 0 UNT [2] — … 一 C 0 UNT [6]— 0。还 

置 R — 乂-:，以便于终止算法。 

R 2. [置 r 为 0] 置 r — 0。 

R 3 .[是否 U ,< U J + 1 ?] r 和 j 增1。如果 L / ; + 1 ，则重复这一步。 

R 4 [记录长度]如果 r >6, 则 COUNT [6] 加1，否则 COUNT [ r ] 加1。 

R 5 .[完成了？]如果1，则返回 R 2。 | 

13. 有 （p + 9 + 1)^: 1种方式得到 R — i — 

去其中 L / 2 — L ；, 的+ 5”种，并减去其中 U l + P . x < 1^ + ；) 的 

\ + 1 / 

q + f + l 种，然后对于同时满足 R 和 U l+ "< 的情况加上1，因为 

这种情况已经减去两次。（这是容斥原理的一个特殊情况，在 1.3.3 节中有进一步 
的说明。） 

14. 长度为 r 的一个运行以概率 l / r !- l/(r + l )! 出现，这里假定诸 L ； 都不同。 

因此我们对于 r < 〖使用久 = l / H - l/(r + l )!， 而对于长度大于等于〖的运行，使用 

■ 

p t = ll t\o 

15. 当 F 连续且 X 有分布 F 时，这对 F ( X ) 总 为真； 见等式 3.3.1-(23) 之后的 
注释。 

16， a ) Zj t — max ( - d > - 1 )) 。因此如果把 ◦ 存人存储器中，则很 

容易把这个数组变换成4的集合，而且不需要辅助的存储器。 b ) 由于他的“改进”， 
每个 V 确实应有所指出的分布，但诸观察已不再是独立的。事实上，当 R 是相当 
大的值时，所有 Z ^， Z ^._ U , ，…， + a 都将等于 L ；,; 所以我们几乎得到重复同样 

数据 z 次的效果（而且这将乘 V 以〖，如习题 3.3.1-10 中那样）。 

17. b ) 由 Bmet 的恒等式，差是 2 o 0<;< „ ( K V ) - ) 2 ，而这肯定是非负 

的。 c ) 因此如果 D 2 = N 2 , 则对于每一对我们必有 L /； V ； - L /； V ； = 0 o 这意味 
着矩阵 

' u ， 0 IA … C 

Vo V \ *•* V ；_, 

x y 

有小于 2 的秩，所以它的行是线性相关的。（假定1// 0 和\^不全为零，则对于 
<^,^ 0 V ；- L /； V 0 = 0 意味着存在常数 a ，/?使得对所有 j ，有 aL /彳 + = 0，利用 

这一事实可以给出更为初等的 证明； L ；；) 和 V ；)全为0的情况，可以通过适当的重新 
编号予以避免。） 

t 

18. ( a ) 分子是 -( L / g - …”，分母是彳^；。- LA ) 2 。（ b ) 在这种情况下，分子是 
-(^0+ 仍+ U 2 2 - UoU .- U , U 2 - L / 2 L / 0 ); 分母是 2 O ； 2 0 + …- l / 2 L / 0 )。（ c ) 由 
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习题答案 

习题 1.2.3-30 或 ^^^ ，分母总等于！ ^〆^^^^^ - U k ) 2 0 

19. 事实上，每当 [J 。， R, … ，的联合分布是对称的（在排列之下不变）时， 

所述结果成立。令 A = [7。+…+ U n ^ 1 S 2 = ⑺+…+ ^ 2 ,-i ， X= +…+ 

U„-2U n - Y + R —iU 。， 而且 D= ”S 2 _ S ?。 还令 E/XW ， …，表示在 D 尹 0 的 

条件支配下 /([/。，…，[^ — 。的期望值。由于 D 是一个对称函数，对于 10,… ， n- 

11 的所有排列/>，我们有 Ef(U 0 r-,U n - l )=Ef( U _ ，…， — d ) 。因此 ES 2 / 

D = nEUilD ， ES\ID ^ n (n ~ 1)E( U 0 UjD) + nEU 2 jD ， 以及 EX/D = 
nE( U 0 UjD ) 0 由此得出 1 二 E(nS 2 - 封 )/D= -U-1)EUX-S?)/D 。 (严格地 
说， ES 2 /D 和 ES 2 JD 可能是无穷的，所以我们必须小心地仅对已知存在的期望值的 

线性组合进行工作。） 

20. 令 E mi ， E 2 ii ， £ 22 ， 五 31 和 E 4 分别表不 E(U 0 UiU 2 U 3 I D 2 ) ,E(UlU { U 2 I 
D 2 ).E(Ul U\ID 2 ) ， E(U 3 0 UjD 2 ) y E( [JVD 2 ) 的值。于是我们有 ES 2 2 lD 2 二 7i(n_ 

1)E 22 + nE 4i E(S 2 S 2 jD 2 ) = n(?i~ l)(n~2)E 2n + n(n~ l)E 27 +2n(n - 1)E 31 + 
nE 4f ES\lD 2 = 72(72-1)(71-2)0 -3)E mi +6n(n ~l)(n - 2) E 211 + 3n ( n - D* 
E 21 + An{n - 1)E 31 + nE 4 ， EX 2 lD 2 ~ n(n ~ 3) E ml + 2nE 2 \\ + nE 22 ,E(XS 2 jD 2 )= 
nU -2)U - 3)E mi + 5n(n - 2)E 21i + 2nE 22 + 2nE 31 ,E(( U 0 - U^lD 2 )= 


6E22 ~ 8 - E31 + 2 仏，因此头 一 个结果为真。 

令》= a((ln n)!n) xj \M = a 3 /2 + 1/3，而且 m =「101。如果我们把分布的范 
围划分成 m 个等概率的部分，我们可以使用尾部不等式 1*2.10-(24) 和（25)，证明 
每一部分以大于等于 1 - 0(n~ M ) 的概率，包含在 ^(1 _幻和 nd(l + 8) 点之间。 

因此，如果分布是一致的，则至少以这个概率 D = ^72 2 (1 + 0(3))。 如果 D 不在此 


范围内，我们有 0 <( L / 0 - 1 / 1 ) 4 / 1 ) 2 < 1 。由于£(( 1/ 0 - 




(x - y) 4 dxdy 




我们可以得出结论， E (( L/ 0 - U . YID 2 ) 


孕 ”- 4 (1 + 0 ( 8 )) + 0 ( n ~ M ) 


注:令 iV 是 （23) 的分子。当所有变量都有正态分布时， W . J . Dixon 证明 
( _ v + zD)/ ”的期望值是 


(1 - - 2zv) il2 (l - 2z + 7 (1 - 2z) 2 - 4w 2 )~ n/2 + 0(w n ) 

相对于 u ； 求微分和相对于 z 求积分，他发现当 n>2k 时，矩量 E(NlD) 2k ~ l = 




k 。 特别是，在这种情况下的方 


差恰是 1 /U + 1) - 1/( 72 - l) 2 o [Annals of Math . Stat . 15 (1944) ， 119 〜 144。] 

21 .在执行到步骤 P 2 时 c r -i = s _ 1 的值依次为2,3,7,6,4,2,2，1，0;因此 


f — 886862。 

22.1024 = 6 ! + 2 - 5 !+ 2-4!+ 2-3!+ 2-2!+ 0-1! ，所以我们要求执行到步骤 P 2 时 
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厂 1 的连续的值依次为0,0,0，1，2,2,2,2,0;若向后运行，则排列是（9,6,5,2,3,4, 


0,1,7, 8) 


23■令 


A 



-公 


x ' - 1 






X 


，: o ] 。于 是，我们有 


Q (工1 


■ 

j 


■ m 


，工 J 


S P ， ( ： vi ， 


yy t ) P (( j：i - ^ l ) mod d ，…人 x L 


y t ) mod d ) 


(义，…，乂） 


更紧凑地 ， QG 
2 r ( Q ( x ) - d 


T, y P\y)P{x-y) 


o 


因此，使用一般的不等式 ( EX ) 2 < EX 2 , 我们有 


K TjyP' (y)(p(x - y) - d 


)) 2 ^ x E y P / (y)(P(x 


y) - 


d 


YiyP '( y ) H x ( P ( x ) - d 


KP(d — d 


[参见 G . Marsaglia , Comp . 


Sci . and Sta tistics ； Symp .on the Interface 16 (1984)，5 〜6。这个结果仅当 d l ^2 X 时才是 

有意义的，因为每个 PU ) 都是 1/ A 的倍数。] 


对于串 a 的头々个和 最后々 个元素写々： a 和 


令 K ( a . B ) 


a 


/?]/ 


PU ); 并令 C 是具有元素 y 


K ( a ，毋） - K(t 


幻的 / 的矩阵。设 C 


是对于 M = r 
些变量受到 


r ， 除以72的随机变量 NU ) 的协方差矩阵。对于/ 


-1 


个串 


a 


的每一个这 


d ^ 1 


N ( aa ) 




S 


d - 


a 


AiV ( M ) 的约束，但是所有其它的线性约束都可从这些 


约束导出（请见定理 2.3.4.2 G ) 


o 


因此 c 有 a -d 


-1 


的秩，而且由习题 3.3. 1-25,只须 


证明 cCc 


C 即可。 


不难验证 


P ( a /?) S U l < A ( a ，/?)， 其中乃 U ，/?) 是当我们在 a 上附加/?并且 


向右滑动 A 个位置时对应于可能出现的重叠的一 个项: 


T k ( a ^) 


例如，如果 d 


2, t 


K ( t~\-k ' a ， p •• t k ) — 1, 

K(a - t — k — k ' j 3) - 1 ， 

5, a = 01101 和 /?= 10101，我们有 4 


如果 k^O 
如果 A > 0 
P (0) 4 P (1) 6 ( P (01) 


- 1 



户(101) _1 +尸(1) — i - W 。 因此 cCc 的元素 ¥ 是 PU /3) 乘以 




d—\ 


S P ( y ^ b ) 2 ^ T k ( a y ya )( K ( a y b ) - DT ^ yb ^) 


I ri 


一 1 ^4^ = 0 


\k\<t \H< 


给定々和/，把乘积 7^( a ， y fl )( K ( a ，6)- l ) T z ( y 6，/3) 扩展到 8 项，当乘以 


P ( yM ) 和对于所有 ya 6 求和时它们的每 


个通常求和成±1。例如，当 a = q …，/? 


=b '… b"7 






■ ■馨 


C L — 


且 t >5 时，尸（7以）尺(2:«，为：2)]<(^6)尺（3:冲，/3:3)的和是 


) 之和，它为 


如果 




同样的和将是 ， M ， 但它将同 P (7 ab ) K (2 


: a ， ya :2)( _1)]<(3:沖，/3:3)之和相抵消。除非否则纯效果是0;否则结果 


是尺（ 2 :(_;‘：《)，（0:/):0-尺（卜1:(_;4)，（0:/ + 1):卜1)，其中^ 




min (t + k，t 一1) 


和 



(0,々十 Z )。 对々和 Z 求和缩短成 


25 .事实上，经验检验证明，当把 (22) 推广成任意 i 时， Cr 1 和 C [ l C 2 C [ l 的对应 


元素之比在时非常接近于 


。例如，当 


6时，它们全都居于 - 6.039 和 


6. 111 之间； 当 


20时，它们全都居于 -20.039 和 -20.045 之间。这种现象需要解 


释。 


26. a ) 向量 （Si ，…， S „) 在超平面 Si 





1中，在由不等式 S t >0, 
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习题答案 


>0所定义的 n - 1维多边形中是一致地分布的点 


0 


^ OQ 

f'OO 

A oo 

dt^ 

ch 2 … 

cU 刀一 i 



5 . 


1 - 


一 广”-1 > h ， 


个容易的归纳法证明 

( 1 — 5! _ 5 2 _ …_ 




n — \ 


72-1) 


n 


为了获得其概率，以在特殊情况 


S 


S 


n 


0下它的值来除这个积分 。 [Brunode 


Finetti f Giornale Istituto I tali a no degli Attuari 27 (1964) ， 151 〜 173。. 

b ) S (1 )^5 的概率是的概率。 

c ) S ( ,)> 5 的概率是5 ; 中至多々 -1 个小于5的 概率； 因此1 - R ( s )= G ^ s ) 
+… + G ^( s )， 其中 G ; ( s ) 是精确地有 ； 个间距小于 s 的概率。由对称性， G ; (5) 


是乘以 ，…， + 的概率；而且后者是 Pr( S L < 5 , 

- x <s ,Sj >0, S ; + ! ^ s , ■ * • , S ;; > 5 ) - Pr ( S t < s , ■ • ■ , S ; _! < 5 , ^ 5 , ■ * * , S„ ^ 

s )。 重复应用 a ) 表明 G)(s) = I n j S/( ~ 1) J ~ 1 (1 ~ (n ~ / 因此 



1 - F k ( s )= 


S 

l 



(- 1 广 ’ — L (1 - 


(n - 


Ds )：- 1 


特别是，最大的间距有分布 


F n ( s )= 1 - X ) 


n 


/ 门、 1 

n — l — 1 

、l , 


— l — 1 ^ 


一 1) 


n — l 


(1 - (n - l ) s )：- 


s 

L 


n 



(- d z (i 


Ls ) V l 


[顺便指出溧似的量/^”-:^^厂卜-^结果是一致离差的和⑺+ 



n 


的密度函数。] 

d ) 由公式 E / 



jo 


(1 




F ( s )) s r - l ds 



和 

J o 



-^)；^ 1 ds 




，我们求得 ES U ) = n ~ l ( H n - H n . k 


，而且，通过一点代数知识， 


ES 2 (k) = n~Hn + I )- 1 [ Hi 2 、- Hi 2 l k + ( H n - 氏 _ J 2 )。 因此 S ⑴的方差等于 n — 1 • 
(72 + l )~ l ( H ( n 2) - H$ k _ ( H n _ fin )。 

[分布 F 、 s 、 首先是由 W . A . Whitworth 在 DDC Exercises in Choice and Chance 
( Cambridge , 1897) 的问题 667 中发现的。 Whitworth 也发现了计算函数 G k ( s ) = 
F k ( s ) - 心 + 1 U ) 中任何多项式的期望值的一个优雅的方法，发表在标题为 The 

Expectation of Parts ( Cambridge , 1898) 的小册子中，并被归人到 Choice and Chance 的 

第 5 版 （1901) 中。对于均值和方差及各种更一般的间隔统计的简化表达式是由 
Barton 和 David 发现的， J . _ Roya _/ Staf . Soc . B18( 1956) ,79〜94。关于统计学家把对 

间隔的分析作为数据潜在偏倚的线索的传统方法的综述，参见 R . PykeJ . i^yd 
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Stat . Soc . B27 (1965) ， 395 〜449。 ] 

27 .考虑由不等式 SiX )， …， S „>0 所定义的在超平面 Si + … + = 1 中的多 

边形。这个多边形由诸 S 的次序定义的（假定诸 S 是不相同的 ）〃！ 同余子多边形组 
成，而且排序的操作是大的多边形到其中… < S n 的子多边形 n ! 对1的折叠。 

把 （ S ⑴，…， S u ) ) 变成 （ S 〗 ，…， si ) 的变换是一对一的映射，它通过 n ! 的因子来扩 
展微分的体积。它把子多边形的顶点(丄，…，丄…， （0 ,…， 

\ n n j \ n - i n - l / 

0，1) 变成分别的顶点 （1，()，•••，0)，（0,1，•••，()）， …， （0, …，0，1)，它线性地拉长和扭 
曲过程中的整个形状。（在子多边形中顶点 

\ J J ) 

>，…，0，士，…，+ 1之间的欧几里得距离是 b — 1 - A — 1 1 1/2 ;这个变换产生一个正规 


的-纯形，其中所有的 n 个顶点都相距 W 。) 


如果我们从图形上考察当 n 


3 时的细节，最容易理解迭代的间距的特性。在 


这种情况下，多边形只不过是等边三角形，它的点由重心坐标 （ x ， j ， 2)，2 + 7 + z = 
1 表示。伴随的图式说明了这个三角形的一个递归分解的头两级。 6 2 个子三角形 
的每一个都已经以两位数代码如来加以标号，其中表示当 （ u , z ) = ( s ^ s ^ 

S 3 ) 被排序成为 （ S ⑴， S ⑵， S ⑶）时可应用的排列，而 9 表示按照代码 


(S,,s 


0 : x <C y K z y 1 ^ x < z < y ， 2 • y K x K z y 

3 - 3 ; < z <C x A - z x y y 5 ^ z <C y x 


(OAI) 



(1A0) x<y (0,U0) 


当 SVShS 〗 被排序时在下一个阶段的排列。例如，子三角形 34 的点有 S 2 < S 3 < 
Si 和 S / 3 < S / 1 < S / 2 o 我们可以继续这一过程直到无穷 多级； 有无理数的重心坐标 

的三角形的所有点因此获得作为一个无穷的 6 进制展开的惟一表示。一个四边形 
可以类似地被划分成为 24 , 24 2 , 24 3 ,…个子四边形，而且一般地说，对于任何^ - 1 
维的单纯形这个过程构造一个 n ! 进制的展开。 
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习题答案 


当 n =2 时，这一过程是特别简单的 ：如果，1 丨，变换就把间距 （ x ， l - 

x ) — (: r ，; y ) 转换成等于 （2: t、mod 1 ,2 y mod 1)或者(2> mod 1 ,2 oc mod 1) ，取决于是 

还是而定。因此重复的检验实质上是把二进表示左移一位，很可能把 
结果取补。在对于 e 个二进位的数做了至多 e 十1次迭代之后，这个过程必定收敛 
到固定点（0，1)。在 72=2 的情况下的排列代码简单地对应于折叠和延长一条 直线; 
划分的头四级有下列四个二进位的 代码： 


(0J) - ' -1-1-!- ' -1- 1 -1- ' -1- ' -1- ' -1- ' - (1,0) 

0000 0001 0011 0010 0110 0111 0101 0100 1100 110) 1111 )110 1010 I0U 1001 1000 

这个序列精确地是在 7.2.1 小节中研究的 Gray 二进制码。 一 般地说，对于一个 n 
单纯形的 n! 进制排列码有这样一个性质，即除了在一个数位位置外，相邻的区域有 
相等的代码。间距变换的每个迭代把每个点的表示的最左数字移出。注意相等的 
生曰间隔是靠近头一级分解的边界的那些点。 

从 （S〆 “，乂）到 （乂 ，…，义）的这个基本变换隐含在 a^ce and Chance 第5版 

中 Whitworth 对命题 LVI 给出的证明中（参见答案26中的参考文献）。它首先是由 
J . Durbin 明确地研究的 [Biometrika 48 ( 1961 ) ， 41 〜 55 ] ， 他是受到 P. V . Sukhatme 
的类似构造的启 不而 进行这 一 研究的 [Arm a As o/Eugenics 8 (1937) ， 52 〜 56] 。迭代 
间隔的排列代码是由 H. E. Daniels 引进的 [Biomefrika 49 (1962) ，139〜 149] 。 

28.(a ) 由习题 5. 1,1-16，把772分成72个不同的正部分的分划数是 

( 777 ' ( 2 1 ) ) °这些分划可以以 d 种方法来排列产生具有0 = ^<3^<*"<1 


< m 的 n 元组（％，•••，％);而且这些”元组的每个都导致有 3 M =0 和0<力，…，％ 
< m 的 U -1)! 个 n 元组。现在对于 每个％ 加上一个常数模这保持间隔。因 


此 ^72 00 ( m ) = mn ! ( n 





m ~ 



\ 2 ) i 


o 


( b ) 零间隔对应于同一个瓮中的球，而且它们对相同间隔的计数贡献 5-1。 因 



n 

n - s 




- 5 ) ( r + 1 



o 


( c ) 由于 


n 

n — 1 


7)， 因此概率为 



29 .由上一个答案和习题 5.1.1-15, 我们有 b n0 ( z ) = n \ (n — l)!z 2 1(1- 

z )-< l ~ z 71 )o 当 r = l 时，在我们前边的推导中的 d 变成为72!/2,而且满足~ 
+…+ = m 的对于的解的数目是满足 （ s ! - 1) +… 



s k - k ) + i ~ k ) + + ( s n ~ n + 1) = m 一 


In' 

\2 I 


~ k 的对于 （X & - — < 
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30 . 对于鞍点方法，这是 一 ^个好问题 [ N . G , de Bruijn ， Asymptotic Methods in 
Analysis ( North - Holland ，1961 )， 第 5 章]。 我们有 p n ( m ) = _ ，其中 /( z ) 

Z TCI J Z 

-- m In z - ^ t b(l - ） 。 令 p = 7?/ t ?2 和 S = \Tnlm ; 在通路 z = e~ p + ltS 上积 

》 CnlS 

分给出 p n ( m ) ^ — exp (/( ei + u 5 )) dz 0 使用等式 

ZTrJ — nj S 


g ( se l ) = 2 ■“) + ^ 0 r, + 1 g ( se l ~ u )du 

j - 0 J • J 0 72 ^ 

是方便的，其中 g = 是任何解析函数而且3是算子^ 4。当函数 以在 #处 

QZ 

被计算时，其结果和当 g ( eO 相对于 z 被微分 j 次是相同的。这个原理导致了下列 
公式： 

me~n -~m[j = l]+^+(-lV22 z -^^V ' ； 

这是由于另一个方便的恒等式所致， g |] 


In 


1 一 e 


2： 


因此我们得到积分项的一个渐近展开 


y B n z n 
7^ i n m 71 


exp /(e? +1 以） =exp 


S 

j >0 






2 


e 


t /2 +/(e 


p 


exp(\C[t - c 2 t 2 - ic 3 ^ 3 + 


_ m 


其中 + + ' 等等；而且结果是对 


于 


2 

0( n 


-3 


分解出常数项 
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习题答案 


立 

2 71 


/( 


_ 

2 tc?i ! p n e 


n 


nip 


exp 


5m 72 一 V + a/4 


2rcn! n n 



SE 

k - 1 i 

18 a — 
^12 n 


B l 


k l p 


a 


+ 


108 a 2 - 36 a 

10368 n 



[+ OU — 3 


给我们留下当 


时其积分项指数地很小的一个积分。我们可以忽略较大的 


值，因为部分分数展开表明积分项是 0(( 


) ;单位的其它根作为分母的一个 


极点没有一个出现多于 n /2 次。因此我们被允许“卖掉尾部” [CMatii 



9.4] 并对 


所有 


进行积分。公式 


e 


12 


t J dt 


3 ) … （ 1 ) [:/•偶]和 


n 1 


(nj e) n y 2 nn exp + 0( 


n 


-3 


足以来完成这个计算。 


以 q n ( m ) 


P 


n 




m 


2 


来代替 p n ( m ) 计算以同样的方式进行，但 


增 


加 yaU 



- n — 1/2 ) 和增加另一个因子 exp 


P 


n + 
2 


我们得到 


Qn ( 


m 71 ~ l e~ Ql4 


1 


m ) = 


n 


!(n — 1)1 


13 a 2 169 a 4 - 2016 a 3 - 1728 a 

288^ + 165888 rz 2 



41472 a 


+ ou — 3 


这和对于 a (讲）的公式相匹配，但 a 已被改变成 _ a 


(事实上，如果我们定义 


Pn( 


m 


)= 


r 


2 


n 



m 




和 


n 



q 


m ) — r 



m 



，生成函数 RA 之 


2 n 

味着- 


2： 


m 




Z 


- k _ k \ - Y 


Z 


个对偶公式 r n {~ vi ) 




1 满足 RAH 
(- D n _ I r „( 




(-I)IU 


在下列意义下这意 


m 


) ，即当我们把 rjm ) 表达作为 m 和 


单位根的一个多项式时这个等式是恒等地为真的。因此我们可以说 Qn ( rn 


pA ~ 


m 


关于这样的对偶性的一般的讨论可以在 G . Polya , Math . Zeitschrift 


(1928) ，549〜640, § 44中找到。）关于进一步的信息，请见 G . Szekeres,Quarterly J 


Math . Oxford 




1951),85 




108；4 (1953) 



/ 


lllo 


当 


m 


2 25 和 


n 


时 ， m ) 的精确值是 7.08069 34695 90264 094 


x 


10 i 514 ; 我们的近似值给出 7.08069 3501 X 10 1514 的估计。 


由习题28,生日检验求出 



0 的间隔的概率，是 “oUW 
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Qn ( 


m 


)= 


e 


a/4 + 0 ( 


n 


m ， 因为来自 


a 



n 01 ( m ) 的贡献〜 



= 0 ( 


n 


q 。 把因子 


gA 


Z 


SdU j - l ) 插入对于〜 （ rn ) 的积分项有以量 + OU — 1 ) 来乘结果的效 


果，因为 g n (e 


—n + 


l 



?? j ^ + 0(n 3 p 2 ) + ItO (n 2 8) ~ 1 2 0 (n 3 S 2 ) 


类似 


地，额外的因子 S 


1 < k < ri 


z —】 -1)0 


4 _2 


k _ 1) 实质上乘以 V 72 



加上 


0(7? 


—1 


); 对于只 


2 的概率的其它贡献是 0(77^) 




这样一来，我们求得 r 个等间 


528 




3.3.2 小节 


隔的概率是 e ~ al 4 ( al 4) r lr \ + 0 ( n _ 1 ) ， 即一个泊松 分布； 如果我们进行展开到 
OU _ 2 )， 则会出现更复杂的项。 

31.79 个二进位由24个3位的集合，丨 y 7 ,， y „ + 31 , y, +55 M Y „ + 1 , y , + 32 , 
L + 561 ，…，丨1+23,1+54,八 +78 丨，加上 7 个另外的二进位匕+ 24 ，…， K +3 。 组成。 


后边这些位同等可能地为0或1，但是三位的每一组，它们将是⑴，0,0|的概率是 


它们将是|0，1，1丨的概率是3/4。因此，对于二进位和的概率生成函数是 /(Z) 二 




| n 
JZ 


2 


4 


24 

\即为一个55次多项式。（好，但是还不十 分好； 严格地说，它是 


(2 55 /(幻-1 )/(2 55 - 1 )，因为排除全为0的情况。 ）2 55 / U ) 的系数很容易由机器计 

算，而且我们求得，有比0更多的1的概率是 18509401282464000/( 2 55 - 1 ) ^ 
0.51374。 


注：本习题是以 Vattulainen ， Ala-Nissila 和 Kankaala 的发现 [ Phys / ca ] Review 

Letters 73 (1994)，2513 〜 2516] 为基础的，即一个延搁斐波拉契生成程序通不过更 
复杂的二维随机步行检验。注意序列^2^7， Y 277 +2，…也将通不过这个检验，因为它 
满足同样的递推。对于1的偏倚也进人由 X n = ( X „_ 55 ± X^ 24 )mod 22生成的偶 

数值元素组成的子 序列； 在二进记法之下，我们趋向于有比（…00) 2 更多的 （•••lOh 
的出现。 

在这个检验中对于数79没有什么神秘 可言； 经验表明，在长度为101或1001 
或10001的随机步行中也存在有面向1 居 多数的重要的偏倚。但是形式证明似乎 

4^3 + 4 x 7 

■—^ -) ;然后我们得 

到因子 （1 + 2之 2 + 5之 3 + 5之 4 + 10/ + 8 z 6 + z 7 )/32; 然后 （1 + 2之 2 + 7之 3 + 7之 4 + 15之 5 + 

25 z 6 + 29/ + 28/ + 13/ + ^ 10 )/128等等。当步行得更远些时，分析变得越来越复 
杂。 

直观上说，出现在头79步中的1的数量优越，只要随后的数在0和1之间相当 
平衡，就会坚持，下图示出一个小得多的情况的一些结果， g 卩生成程序= ( y „„ 2 

+ y „- ri ) mod 2,对它容易进行穷尽分析。在这种情况下，长度为445的随机步行 

有6496的机会在起始点的右边 结束； 仅当步行的长度增加到周期长度的一半时这 
种偏倚才消失（当然，在这之后，有可能有更多的0,尽管完全的周期仍然缺一个0)。 


是困难的。在86步之后生成函数是 



3 



2 v 17 


1 + 2之 2 + 



8 



= 八-2 ㊉ l-n 时在随机 m 个元组中1的个数超过0的个数的概率 
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题答案 



LQscher 的拋弃技术可用来避免向1的偏倚（参见3 . 2 . 2小节的结尾）。例如， 
对于步55和24,当在165的批中生成数时，如果对于每一批仅仅使用头55个数的 
话。对于长度为1001的随机步行未发现随机性的偏倚。 


32.相对于概率 


2 


山 2 


，如果我们取值 （ -1-2( 2 ，广2人1-20，则不 


然。如果 e 充分小，则以+ + 




■的概率， x + y > o 。 [因此，基于他们的平均 


得分，两个高尔夫球手可能水平相当，但是一个有更大的可能在一轮淘汰赛中取胜， 


而另 


个人则将更经常地在两轮中取胜。关于对于类似现象的讨论，参见 T . M . 


Cover , Amer . Statistician 43 (1989) ,277 




278 0 ] 


33 .我们实质上要 


U + / —1〉/2 



Z 


k 一 1L 



3 之 


2 


4 


/(I _ 


z 


令 


m 




是 - 2/ 和 


n 


； 要求的系数是 + O e 

ZtciJ 


g ( 


dz 

2： ( 1 — 


z 


，其中 w 


z) — m 


In 



Z 



+ 


n 


In 


1 + 3 z 2 


m 


4 


+ 3 n — 
~2 """" 


lnz 。 沿着 z = ，来积分是方便的（和见机行事的）， 


其中 


4/ ( m 十3乃 ） ，而对于一 


< t 




一 1 



i ^ o 我们有 g(e 


04 


u 2 /2 



C^u 


十 C 4 f 2 M 4 十 c k 




2 


分 ga)i k \ 


0(1)。 还有 1/(1 - e fU )= 


ml 2 
-1 



+ 


m 




2 


- B 


o(U 


/ 2 ! 


。乘出积分项和使用;^ e 

Zttij 1 一 ioo 


J[ + i oo n I 

w 2 /2 dw 


u 


1 1 Ca^i°° 2 1 

7 T 和: ■ e w 2 u 2k du 

jL lLTZXJ a — \oo 


- l ) k (2 k - l ){2 k - 3)*"(1) v ^ x 产生渐近公式 y + (27 u )~ 1/2 77 ( 




0(( m 


3 ti ) _3/2 )。 如果 m 



3 n 是偶数，假定我们给出 z ( m ^ n )!2 的一半系数为1和一半系数 


为0,则相同的渐近公式成立。这个系数是 


2 


1/2 


TTV m 



3 


n 


+ o(( 


m 


— 3 n )- 3l2 ) 0 


34.排除一个给定的两个字母的子串或子串对，长度为；^的串的个数为在一个 


适当的生成函数中/的系数，而且它可以被写为 


ce nr m 
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0(1)，其中 c 和 r 有在 




1/ m 的幂之下的级数 展开: 


情况 

被排除的 

生成函数 

c 

I 

aa 

(1 + z)jp(z) 

1 + <2 一 2^+‘“ 

2 

ab 

1/(1 - mz + z 2 ) 

l + ( 2 + 3/+ … 

3 

aa y bb 

(1+ z)/(p(z) + z 2 ) 

1 +2( 2 - 4/+ … 

4 

aa, be 

0 + z)Kp(z) + z 2 + JT 3 ) 

l + 2( 2 -2f 3 + … 

5 

ab , be 

(l + z)/(l 一 mz + 2z 2 ~ z 3 *) 

l + 2c- 2 -2r'+ 

6 

ab y cd 

1/(] 一舰 + 2z 2 ) 

1 +2( 2 + 12^+ … 


r 



_ 2(^ 2 + 2<^-8( f4 + … 

- 2 c 2 + 夕 - 7/ + … 

- 2( 2 + c 3 - 6^ 4 + … 
— 2^ — 6^ 4 + … 


(这里， a ， b ， c ， d 表示不同的字母， 〆 2 ：) = 1~ (m ~ l )( z + z 2 ) 0 结果，排除 U 6 ， 6 a I 或 
\ aa , ab \ 的效果等价于排除 i 似 ， M | ;排除， ac 丨等价于排除丨以， d 丨。）令是在 


情况 J /中/的系数，并设 X 是不出现的两个字母组合的总数，于是 EX = ( + 

而且 
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3.3.3 小节 


EX 2 = ( mSi ° + m 2 ( S ( „ 2) + 6 Si 3 )) 十 2 t ? z 1 ( S 1 4) + Si 5) + S ,) 十 ?n 4 -S ( ^ ) )lm ,1 

35. a ) ES ; , = S ?:。 1 S ； L " 0 1 Z , +; = N~ l S ;:。 1 Z , …二 WN ， 因为 

S M v r 0 1 Z , ;+ J -2^ 1 -(2'- 1 -l) = lo 

b ) 令 # = L + … + & ，并且把线性函数/定义为习题 3.2.2-16 的头一个解。 

于是氕= /( f 1 ) ，而且由此得出，1山.+ 八 +, = /($” + 0 + /( r + ; ) 三/、( r + ; + r +; ) = 

/( ra )( moql U k )2)， 其中当 2 •矣_； (modulo iV ) 时 a 非零。因此 ESi =/V — 】 S ;% 1 S ^ Vo 1 

S ^ Z„ + L Z 7l + J -N- l (ET=V^=oZ 2 n + l ~2'Z 0<l<J<m ^^Z n 、二 m _ m ( m _ 1) / 


c ) 当每个 Z , 都是真正随机的时， E SjL ' o 1 4, +7 = Sf = ~o 1 EZ , + ; = 0 和 

E ( S ； V 0 l ^ + ; ) 2 = Sf ,- 0 1 EZ ^ 十 j + 2 o </<；< m ( EZ , 山 ）（ E 乙幻） = m 。 因此当 m 《 

/ V 时 S „, 的均值和方差非常接近于正确的值。 

d ) ES 3 W 二 o 1 ];:—(/ S ^ oA+Z + ^ h 。 如果 / i “ 或 j 的任何 

I 

一个都相等，则对〃的求和为1;因此 


N-1 


ES 


7)1 


N 


m 


) 丄 

7?2一 + 





+ h 


7 7 

^ 7 / + tl 


■ 

幻 


0</i< i<)< m w 二 0 


像在 b ) 中那样进行论证，我们发现若果 f f f 乒0，对77求和将为1;否则它将 

是 - N 0 因此 ES 3 w = 7 n y - 6 B(/V 十 1)/ N ， 其中 B 二 Yj ^ h < i < j<m [ ^ f f = 0] = 

S 0< ,<, <; Jl + f + e = o ] u - j )。 最后发现在这个域中 1 + f = $当且仅当对于 

0</<々，/( e …） Kf 7 ，， 假定 0</：<7< No 

e ) 对7： -31 ^ j = 55有惟一非零项 出现； 因此 B =79 - 55 = 24。（当 z = 62和 j 

= 110时下一个非零项出现。）在真正随机的情况下， ESi 应当为零，所以这个值 

ES 〗 9 144是显著地非随机的。奇怪的是它是负的，尽管习题31证明， S 79 通常是 

正的。当它确实骤降到零之下时， S 79 的值趋向于更严重地为负。 

参 考文献 JEEE Trans IT -14(1968) ，569〜576。通过 M , Matsumoto 和 Y . Kun - 
ta 的实验 [ACM Trans Modeling and Comp . Simul . 2 (1992 )，179 〜 194 ; 4 (1994)， 
254 〜 266] 确认基于三项式的生成程序不能通过这样的分布检验，即使当步子很大 


时。也见 A CM Trans . Modeling and Comp . Simul . 6 (1996) ， 99 〜 106 ，其中他们揭不 
了低密度的指数级长的子序列。 


3.3.3 小节 

1- y((^ly)) + 士 V - * yS (x I y ) 。 

2.({ x )) = - S „^ i—sin 2 -kiix ，它对于所有的工都收敛。（在等式 （24) 中的表 

UTX 

示可被认为是对: r 为有理数的情况的“有限”的傅里叶级数。） 
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习题答案 


3 .和是 ( {2 7] x )) — ((: c )) 0 [ 见了 Vans , Amer . Math . Soc . 65 (1949) ,401 


O 


4 d max = 2 l 0 .5 o 注意 + , < X , 的概率是 f 十^其中 




( 




所以从定理 P 的观点看来，每个效能为 10 的生成程序都是很不错的。 


5. 


个中间 结果: 



JO s 


u ) 


m 


0^ jc < 


m 


m 


771 


Y2°^ a 2 ， c) + 4 


c 


X 


2 


m 


2 


m 


6. a ) 用归纳法和公式 


hi 



c 


k 


十 C _ 1 



1 


k 


l A h -h 



c 





8 


b ) 利用事实 


.llhl 


k 



i 


I \ \ 


丄 _ 

hk h 11 


ki\\ 


h 


7 •在习题 1.2.4-45 的第二个公式中取 w 


h , n 


i ! 


k . 


hk 



hj + c — 

k 


2 d \ k i 


o 




Ihj 


0< j<k 


hi 

k 


+ 


l \ ihj _ 


2 


I h J 


k 



2： 
1 \ 


2 



2 



0<j<h 


hi 

h 


hi 

h 



2 


kh(h - 1) 


简化左边的和数，并由标准操作得到 

7 2； , 7 h h 2 

h k — hk — ^ ■十 77 

2 bk 






+ " 
12 4 


^(h ， k ， Q)-^U ， h ， 0) 




12 


口 （ l ，々，0) 


h 2 k - hk 


由于 CT ( lj ，0) = U -1 )U -2) M ， 这约化为互反律。 


8. jaDu/ce Math .]. 21 (1954),391 
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.由有趣的恒等式 S “ a 々 Wr 」 Lh / r 」+ ^ VJolkrlq ] 


Ikplqj 




(p - l)(q - l)(r - 1) 开始，假定 p 丄丄 r 和 r 丄 p ， 对于它可能有 


个 




简单的几何证明。 [U. Dieter ， Ab/i. Math. Sem. Univ. Hamburg 21 (1957)，109 

125 o ] 

10 .由 （8)， M 然 < y(k - h y k , c ) — _ < y ( h ， k ，- c )。 在定义 （16) 中用 k ~ j 代替 j 
来导出 (J { hykyC ^) — ( j{ll y k ^ ~ C ) 


lLa 


S 


o <;< 办 


dk 


hj 



c 


k 


s 


((ik 


0^ i<d 

0^ j<k 



1 


dk 


hi 



c 



利用 （10) 来对 


求和 


o 


b ) 


I (hj + c + Q \ 


k 


lihi±A\\ 


\\ 


k 



Q 


k 





C 





; 现在求和。 


12 .由于 




c 


k 


以某个次序取遍同 


丄 

k 


样的值，柯西不等式意味着 


o 


U ，々， c ) 2 < j (/2， M )) 2 ; 而且 a ( l ，々，0) 可以直接地求和，参考习题7。 
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13 •如果 


1 (modulo 々 ） ，贝 ll 


a{h y k y c 



3 (k - 1) 


12 


k 



S 

Q < j<k 


CO 


Q 


Cl) 


—心 _ 


+ 





mod 


6 


h ， 




14.(2 38 - 3-2 20 + 5)/(2 70 - 1)^2 


- 32 


DU _1) T 广 1 一 …、 k A // 
尽管有局部的非随机性，但是整体值令 


人极端满意 


15 .用 Lc 」「 c 1 来代替 （19) 中出现的 c 


o 


16.对于 


所提示的恒等式等价于= Pr^r + l + Pr \m 


r + 2 


这由归纳 


法得出 


o 


(也可参考习题 4.5. 3-32。）现在用 2,< / <人^^ + 1代替0 ，并比较有待证明 


的恒等式两边的系数。 

注： 对于所有指数我们利用类似的论证可得 


S 


e 


1) 




m 


2 (- d ;+1 


e 


e 


17 .在这个算法运行期间，对于 j 


1 

= 1,2, 


IV v 

Cj - c J + { 

“ + 1，我们将有々 


Pj 


m 


，h 


m 


c = 


c”P 


Pj-\，P 


m •[初始化] 


:岛 - 2 ， 5 二 （-1 )) 1 0 
置 — l，p 


/ 


D2 •[ 除 ] 


置 


a 


ikih\,b 


I h j , 


r 


^4— 


0 ， 5—lo 

mod A ( 现在 a 


a 



6; ，且 



Cj + [ ) o 

D 3 .[累加] 

0,置 A 


2 (- 1 ) 


置 A 


A + 


a 


- 6 b ) s y B^B + 6 bp ( c + r 


如果 


r 


< — 


A _ 3 s 。 如果 /i 


1，置 B 


B + ps 


(这减去 Seim ： 


关0，或 c = 

， C ,) 并注意 


1 / 


77um 


D 4 .[准备下一次迭代] 


个项 

置 


^— 


r ， 5 


^— 


—s r 


<— 


k — ah ， k 


M — 


h , h 


< — 


r ； 


置 



ap 



/ 


/ 


p 


p^p 



如果 /i >0,就返回 D 2。 


在这个算法结束时 j 将等于 


原来的值々 


如果 5 <0,则 / 最后的值将是 V ，否则 〆 将是 
可能把 B 保持在 0< JB < 蚪的范围内，因此如果 
的操作（以及双精度的乘积和被除数）。 


所以所求的答案将是 A + Blpo 
h '。 通过对 A 作适当的调整，有 
n 是单精度的数，就只要求单精度 


18.稍经思索即知对于所有的2： >0( 而不仅仅当 k ^ z 时）公式 


Slh ， k ， c ， z 


s 


0^ j<k 


(UM 」 -L(j 


) lk])(((hj 


事实上是正确的。令 Lj / 是」 


_(j — Z)l k ] 


Z 





+ 


z 


k 



+ y ^0 


2 


8 


z 



并求和即得 S (/ l yCyZ ) 


zd 



d 


+ y^a(h y k y hz + c) — 


+ 


hz 





2 


k 


2 



，其中 d 


gcd(/i , k ) 


O 


[给定《，这个公式允许我们 


借助于广义戴德金和表达 

19.所求概率是 


< X „< a 的概率。] 
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习题答案 




m，c + aa — a ') — a(a y m y c + aa — 




a(a y m ,c + a/? - 〆 ）一 a(a ,m ,c + ap - a)) + f 


其中卜 K2.5/m 。 

[ 这个方法是由 U.Dieter 给出的。根据定理 K ， 真正的概率与理想的值 


^ - a 
m 



的差异不超过 iiMm; 反之，通过适当地选择《， /? ， 〆 ， /? 、由定理 K 是 

m 

“ 最好的 ” 这一事实，当有很大的部分商时，我们至少能把差异的界缩小一半。注意， 

当 a 〜 ^ 时，这个差异不能超过 0(l/vG) ， 所以甚至习题 14 中那个局部非随机 
的生成程序也能很好地通过全周期上的序列检验;看来我们应当坚持极 小的差 异 。] 

20. Sooc w 「（: c — s (x))l m^[ (s (jo) s (s (x)))lm Mm = 2o<x<m (( 工 — 


s(x))lm + (((^ + c)/m )) + y j (“ （ : c) _ s(s(x)))l m + ((a (bx + c)/m)) + 



; 而且 x\m — ((xl m)) + 



s (x)l m — (({ax + c)l m)) + 



-^-d((ax J rc)lm),s(s{x))lm^{{{a 2 x + ac J rc)lm))^-^---^-d{a 2 x J rac + 

c)l m 。 设 5 (〆 ） =KsCx") ) = 0 且 d = gcd( 6 ， m ) 。如果 a'a 三 1 (modulo m ) ，则现 

在这个和约简为 


1 

4 


I ^( S 1 - S 2 + S 3 - S 4 + S 5 - S 6+ S 7 - 


S 8 



S 9 ) 







2 m 





\ / 




\\^ } i 



其中 S\ = a (a ,m y c) y S 2 = cf( a 2 y m ^ac + c) c^(ab y ac) (j(l y m y 0)- 

(m ~ 1) (m — 2)/m,S5 = cr(a,m,c),S6 = cr(6,m,c),S7 ― — a {a — 1, m , a c ) 及 
Sg = - (〆-1) ， m , (a') 2 c) ; 而且最后 


s 


12 



I I bx + c \ \ ( i a {bx + c) \\ 


0^ x < 


m 


\ \ 


m 


)i 


m 


• 534 • 


lid 2 


X 



< mid 


m 


Col d 

Id 


a {x 



c 0 / d ) 


m 


id 


12 d Yj 


X 


O' x < ” jI d 


m 


Id 


+ 




m 




2 


d 


a { x 



cold ) 


:cO 


m 


Id 


d 


a 


( ad , 


m 


， 沉0 ) 



12 


c o 


m 


~d 


- 6 


ac 0 


m 


其中 Co 


C mod d o 当 d 很小且分数 a / m ，（ a 2 mod m)l m y (ab mod m)l m ， bl m , 


( 〆 — 1)1 m ,{a (a - 1) mod m)i m y (( ad ) mod m)l m 的部分商全都很小时，总和 


将接近于 



(注意 ， a / _ 1 


一 b 十 b 2 - … ，如同在习题 3.2.1.3-7 中那样。) 


21.首先注意，主要的积分可很好地 分解: 


X 




d\Ax 


a 



备+号)，如果: 


71 


- 6 


a 


x 



+ 6 \dx 




^0 + & + “• + 5 a _! 





-dl a 


d)d 



X 


3 a 


2 a 


+ 


a — 1 

4 a 



I 

Ya ° 


因此 C 


2 



2 


(1 — 6d + 6d 2 )la 


22 .在不相交的区间 



a 


l- e\ 

’a _ 1 J ’ 


2 - 



a 


2-d\ 

’a - 1 J ’ 


a 


— Q 


a 


，1 中，我们有 


这些区间有长度 

i + 2 


0 < j^a-l 


0< j^a 


- 6 


a 


1 + y - ^ - 



2 



6 


2 


23 ■当对于 0 < j < A < a ， x 在 


k 



a 


k -6 

，a — 1 


之内和 


ax 




_ 是在 


i - d j ~ d 

a J a — 1 


之内时；或者当： c 在 


a 


— d 


a 


， 1 ) 内且 a jc + 汐 — a 在 


i ~ 6 j - d 

a y a — \ 


之内 


(对于 o < 或 


_ad ] + 1 — 




a 


之内时，我们有•(: r )<: r ， 所求的 


概率是 


S 


0< j ^ k<a 


j ~ 6 + y j - 6 + 

a 2 (a - 1) a<1^f a o\a 2 (a - 1) 




max(0 y \ad\ 



6 ~ l ) 


a 




d / 一 a 汐」 （|_ fl 沒」 + 1 ~ 2 d ) 

2 a a 2 { 2 (a — 1) 



max 


(0,I 



d - 1) 


对于很大的 a ， 它等于了 + (1~ 3 d + 3 d 2 )/6 a 

o 

所以 e 不能选择成使这个概率为真。 

24.沿用上题的解法，区间长度的和是 



0( l/a 


注意，1 _ 3沒 



30 2 > 


4， 




a t — 2. 




a l ~ x (a - 1) 


a l ~ l (a - 1) 


535 


习题答案 


为计算平均长度，设九为长度大于等于 A 的一个运行的 概率； 平均值是 


Yjpk 二 

k ^\ 



a 




- 2 \ 


k^i 


k 


I a k ^ l (a - 1 ) 



a 

a — 1 


一 个真正的随机序列的值将是 e - l ; 而我们的值是 e^l + ( el 2- l)la 十 0( l / a 2 ) 0 
[注 :对 于一个递增的运行同样的结果成立，因为我们有1^>仏 + 1 当且仅当 1- ^<1 
- U n + lo 这将使我们怀疑，线性同余序列中的运行可能比通常的运行更长些，所以 


应当把运行检验应用到这样的生成程序上。] 

25. 对于某一个 k y x 必在区间 [(6 + 〆 _ 6)1 a , (^ + /?' - 0)/ a ) 中，并也在区间 
[«，/?)中。设 々 o =「aa + 6-/ n，h =「#+0-/ n 。 由于边界条件，我们得到概率 

(k x - k 0 )(^ - a)\a + max(0,/? - ( k { + a' ~ 6) I a) ~ max(0, a ~ ( k 0 ^ a' ~ 6) I a) 0 

这是 （/? — a)(〆 - 〆 ）+ (， 其中 M <2( 〆 -a )ja o 

26 . 见图 A - l ， 次序 U v < L / 3 < L / 2 和 U 2 < U 3 < U { 是不可 能的； 其它四种次序 


的概率均为 

27. U n - | F „ _ t L / 0 + F n Ui I 。我们需要有 l / 0 + < 1 和 F k U 0 + F k + iU 1 > 

1。与 L / Q > LA 相对应的半单位正方形按々的不同值，被分割成如图 A -2 所示。如 

果々=1，则对于长度为 A 的一个运行的概率为 I ;如果々>1，则概率为 llF k - { F k + , 

- llF k F k + 1 。 对于一个随机序列，相应的概率是 M/U + 1)! -2 U + 1 )/U + 2)!; 下 
表比较了开头的一些值。 


斐波那契情况下的概率： 
随机情况的 概率： 


1 


2 


3 


4 


5 


1 


1 


2 

3 

10 

24 

65 

1 

5 

11 

19 

29 

3 

12 

60 

360 

2520 



圏 A -1 斐波那契生成程序的排列区域 




A - 2斐波那契生成程序的运行长度区域 
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3.3.4 小节 


28.图 A -3 示出一般情况下的各种区域。如果 R 和 U 2 是随机地选择的， 
“213” 区域意味着 U 2 < U l < 区域“321”意味着 lh < U 2 < U ^ 等等。 123和 

321的概率都是 | - a/2 + a 2 /2 ;所有其余情况的概率都是 j + a\\ - ct 2 14 。 为使所 

有这些概率都等于我们必须有1 -6 a +6^ = 0。[这一习题建立了 J . N . Franklin 

0 

给出的一个定理，见 Math . Comp . 17 (1963),28 〜59,定理13; Franklin 的论文的其 
它结果同习题22和23有关 J 



图 Ar 3 具有效能2的生成程序的排列区域 ； a = (a - l)cl m 


3.3.4 小节 

1 . 对于极大周期的生成程序，一维的精度 h 总是 m 且& =2。 

2. 设 V 是行为％，•••，％的矩阵。在 y 关(0, …， 0) 和是整列向量 X 这两 
个条件下使 Y * Y 极小化，等价于在 X 是非零整列向量的条件下使 （ 
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题答案 


X)极小化。V 


一 1 


的列是 A ，…， u t 


3 . a 


2a - 1，且 a 


3 a ~2( modulo m ) 0 通过考察 （15) 的所有短的解，除了 


下列情况外，对于向量（1，-2, 1) 和（1， -1， _1，1)我们分别求得4 


6和4 


4。 


这些情 况是： m 


2 e q , q 为奇数， 


2 


e 


(modulo 2 e ) y a 


1(modulo q ) y ^3 = 



2; m 


?> € q ，3 丄 g ， e^2 , 


a 


1 ± 3 e — 1 (modulo 3 e ) ^ a 




1(modulo q ) y vl — 2 ; m 




4 或7, j 




5 o 


4. a) 对于 （ a ，工 2 )的惟一选择是 一（3M 以 22 _ 3^21 ， — 3^12 + 3^11) ，而且这 





m 


( yiu 22 + 


y\u n ^ : y2 ⑽ i2) 


(0,0)(modulo 1); 即 


l 


和 


都是整数 


o 


b) 当（: C】，JC 2 )#(0,0) 时，我们有（: Ti 



^2^21 ) 



(^1 


u 12 



: C 2 l / 22 ) 


X 


2 / .2 


(U 


11 



u \2 





oo\(i 

\)(u 


以 21 



11 



u \ i ) + 2x v x 2 ( u n u 2 i 

Wi 2 )^Wll + W〒 2o 



w l2W22 ) ，而由假设，这大于等于（: r 




[注意，这是比引理 A 更强的结果，引理 A 仅告诉我们 xK(^ii 



u 2 l 2 )(u 2 21 



4)/m 2 和 xK(^ii + 以 2 ) 2 /爪 2 ,其中后者可以大于等于1。这一思想实质上是高 

斯的一个约简的二元二次型的概念，见 Disquisit/ones Arithmetcge ( Leipzig： 1801 ) ， 
§171。] 

5.条件 （30) 保持不变，因此当 a 与 m 互素时 A 在步骤 S2 中不能为零。由于在 
该步中 / i 总是减小的， S2 最终以？+结束。注意，在整个计算过程中 pp < 


0 


所提示的不等式在头一次执行 S2 时确实成立。由等式 (24) 可知，极小化 


h ) : 

(P 



( P - QP ) 2 的 整数〆 是 q = ro ^ 
qp ) 2 < h 2 + /) 2 , 我们必定有 


round( (h h + p p ) 1 ( h 2 



p 2 )) o 如果 UW/l) 





关 - 1，因此 


) 2 >〆 ，因此 


(h/ — q h ) 2 < /i 2 , SP I W 


q h 


即 


是 G 或 


我们有“ 



pv > h ( h ’ 


qh ) 



P(P 


P )> - ~2^ 2 



P 


所以如果 



V 


步骤 S2 的下一迭代将 


保持提示中的假定。如果^ 



V 


^5 ^ {u - h) 1 + (v - p ) 2 ，我们有 2 \ h ( u - h ) 



P ( 


v 


~ P ) 


2(h(h — u) + p{p — v)) 




(u — h) 2 



v 


- p ) 2 + h 2 



/ > 2 -( 


u 



V 


^( w — h) 2 

后如果 w 2 _ 
; 则 2 \ hu ' 



(v-p) 2 < ： h 2 



p 2 , 因此由习题 4 ,(w- /i) 2 十 （w — p) 2 是极小的。最 



2 禾 n ( w _ /i ) 

pv " \^ h 2 



v 


P ) 2 都大于等于 h 令 2 / 


h / 


q h ， V ' 


P 


Q 


p 2 ^u 



r /2 , 且由习题 4，A 



p 2 是极小的。 


[Kaib 和 Schnoir 讨论了相对于其它的度量求最短的 2 维向量的推广， J. Aigo 


rithms 21 (1996) ，565〜 578] 。 

6.在上一答案中，如果 

因此 （w - A) 2 <w 2 ; 而且如果 q — a 

得出在习题 3. 3.3 - 16的记号下， d 


(u — h ) 



(v - p ) 2 我们有 (v - p ) 2 > v 2 , 


a } ，使得 /i 


七 /i 十 w， 我们必定有 a j + 1 = lo 由此 


mino 彡〆 


m 



现在我们有 mo 


m jPj 



yyi )\ P } -\ ~ a j m jPj 



Pj - 。 

^ jPj - 2 + i pj 


a 




3.3.4 小节 


l /<2 ; ) nijpj - ^(A + l + l / A ) rrijpj -[ ，而且 m ) + p )^ { ^ 2 v 2 J p j - y , 因此就有所求结 
果。 

7. 利用条件（19)，我们将证明，对于所有 k ^ j , U r U k = 0 当且仅当对于所有是 
V ; - V ,=0 o 假定对于所有々乒厂 R =0,并设 L / ; = & % +…+〜％。于 

是对于所有 k y Uj - U k = a k ，因此对于所有 k^j , Uj = ajVj ，而且 Vj • V k = a ^ l ( Uj - 
V ,)-0 o 一个对称的论证即可证明其反面。 

8. 显然， + (这是算法 S 中隐含的一个事实，因为当〖增加 s 不变）。对于 

t = 2，这等价于 ( m " 2 /7 i ) 1/2 > (吾 m " 3 /7 t ) ，即 " 3 《音 V m / njul 12 ，由给定的参数，这 

个上限归结为 | l ( T 4 /^ r ， 但对于很大的 772 和固定的/^，上限 (40) 是更好的。 

9. 设 /(3 M ， …， 3^) = 心则 gcd (3 M ， …， M ) = 1，所以有行列式为1的整矩阵^ 
以（^，…， M ) 为它的第一行。（对于这行中最小非零项的量用归纳法来证明这一事 
实。）现在如果 X = ( x !, …， A ) 是一个行向量，我们有 = 当且仅当叉= 

，且是行列式为1的整矩阵，因此由 WL ； 定义的 g 型满足 g (:^，…， X ,) 

= f ( x ' li '' 4 y ^\) ;而且 g(l ,0 , *•* ,0) - do 

不失一般性，假定 f = go 如果现在 S 是任意正交矩阵，则矩阵 L / S 定义和 U 
相同的型，这是由于 （ XUS )(； a ； S ) T = ( XU )( XU) r o 选择 s 使得它的头一列是 
uj 的一个倍数，而它的其它列是任何适当的向量，对于某些 ，…， a , 和 （ z -1 )X 

( r -1) 矩阵 IT ， 我们有 


0 … 01 


US = 





IT 



因此，/(X 】，…， + … + aA ) 2 + / i ( x 2 , …，4)。由此得出[事实 
上，对于七 = (LV A)/#]， 而且/I 是由定义的正定二次型，其中 

d e tLT = ( detL /)/ v ^。 对 Z 用归纳法，有整数 （x 2 , …， a ) 使 

/ A \ (t -2)12 

A ( x 2 , …，々）< 皆) I detU | 2 /( h )/ V " h ) 

而且对这些整数值我们可以选择 A 使得 | n + ( a 2 J 0 2 + •** + oit^t )/«i I ^ y , W 

( a { Xi + … + ) 2 < + 沒。因此 

1 I A \ ^ L —2)/2 

<9 < /(: r ! ，…，: r ，） 《了沒 + f ) I det L 7 | 2/( 卜 ”/ 沒 "( 卜 ” 

4 V 3 / 


因此立即得出所求的不等式。 
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习题答案 


[注 ：对于 z =2这个结果是最好的。对于一般的 iHermite 的定理意味着 

n a 2 (4 l 3) iCt - l ) l 4 l ( tl 2)\ 0 Minkowski 给出的一个基本定理（“每个〖维的关于原点对 
称的且体积大于等于 V 的凸集含包含一个非零整数点”）告诉我们对于 

9这是比 Hermite 的定理更强的。已知还有更强的结果，参考(41)。] 

10. 由于％和 3 ； 2 是互素的，我们可以解 u iy2 - u 2 y x = m ; 而且对于所有 

q y (u i + qyi ) y 2 ~ ( u 2 + qy2 ) yi — w ， 所以通过选择一个适当的整数 g ， 我们司以确 

定2 | u x y x + u 2 y 2 + 3^2。 现在夕 2 (以 1 + au l)=yi u 1 — ^1 w 2 三 0( modulo 777 )，而 

且： V2 必定与 m 互素，因此心+ <2 w 2 = 0 o 最后命 I u { yi + u 2 y>2 I = , u \ + u \ — 

Pm , + ^2 = y m 5我们有士/，剩下的是要证明士/?和恒等式 

(心3；2 _ “2 3^) 2+ + (4+4)(： y ? + ： y !) 意味着 l + a 2 = /?/。 如果 

a > +/?，我们有 2 ay 〉1 + a 2 ，即 y - J y 1 y 0 但是臺 y < \/ y 2 - 1 意味着 

y 2 〉皆，矛盾。 

11 . 由于 <2 是奇数，3^ +力必为偶。为避免: yi 和： y 2 都是偶数的解，命 : Vi = ii 

+ x 2^y2 = x \ _ 工 2, 并对： Cl 丄工 2 和 X! 为偶数解 x\^ x\- 772 /V3 - f ; 对应的乘数 a 
将是 （ X 2 - x\)a = x 2 + x I (modulo 2 e ) 的解。不难证明 a 三 1 (modulo +1 ) 当且仅当 

x x =0 (modulo 2巧，所以当& mod 4 = 2时我们得到最好的效能。问题归结为求 

x \ + d = iV 的互素的解，其中 iV 是形如 4 A + 1的很大整数。通过在高斯整数上分 

解 N ， 我们可以看到，当且仅当 iV 的每个素因子（在通常的整数上）有 4 A + 1 的形式 
时这些解存在。 

根据费马的著名定理，形如仏+ 1的每个素数可以以惟一的方式（除 W 和！； 
的符号外）写成为 p = u 2 + v 2 = (u \ v ) (u - iv ) , v 为偶数。通过解 x 2 = ~ 1 

( modulo />)， 可以有效地计算数 W 和〜然后通过高斯整数上的欧几里得算法，计算 
u + \ v = gcd ( x + i ，/?)。 [我们可以对几乎 一 ■半的整数取 : r = n( p - ')丨 4 mod >，欧几 
里得算法的这一应用实质上等价于求使得 w ± 三0 (modulo >) 的最小非零 w 2 + 
V 1 。 当以通常的方式应用对于整数的欧几里得算法于和: T 时，也出现〃和1的 
值；参见 J ■ A . Serret 和 C . Hermite , J . de Math . Pures et Appl . 5 (1848) ， 12 〜 15。] 如 

果 N 的素因子分解是抑 … w i ㈤ ） e i ( Wl - _ …+ i 。,）' ( Wr - it ； r )' ， 

通过命 I X 2 I + i I X! I = ( W! + ）M 土 iP2 广 2 … （〜土 k 〜，我们得到 x\ + x\ = 

N ，:^ 丄: T 2，/ 为偶数的 2 P 1 个不同的解，而且所有这样的解都是以这种方式得到 
的。 

注：当 m = l ( T 时，可以使用一个类似的过程，但由于我们必须继续试验，直到求 
出满足 Xl =0 (modulo 10) 的解，所以它有五倍的工作量。例如，当 m =10 1() 时，我们 

有 Lm /乃」 = 5773502691 ， 且 5773502689 = 53- 108934013 = (7 + 2 i )(7 - 21)(2203 + 
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10202 i)( 2203 - 102020 o 在两个解 U + i| a：i I = (7 + 2 i)( 2203 十 102020 或 （7 + 
20(2203 - 10202 i) 中，前者给出 I 工！ I = 67008 ( 不好），而后者给出 Ui I = 75820 , 
U 2 | = 4983 ( 它是可用的）。通过取 ^, = 75820,^2 = - 4983 , 得到表1的行9。 


表 的第14行是这样得 到的： L 2 32 / V 3 J = 2479700524；我们降到 N = 2479700521, 
它等于 37.797*84089 并有四个解 N = 4364 2 十49605 2 = 26364 2 + 42245 2 = 38640 2 + 
31411 2 二 11960 2 + 48339 2 0 对应的乘数是2974037721,2254986297,4246248609以 

及 956772177。 我们还试验 IV - 4, 但它不合法，因为它可由 3 整除 。 另一方面，素 
数 iV - 8 = 45088 2 + 21137 2 导致乘数 3825140801。 类似地，从 N - 20 , N - 44, N - 

48等等我们得到另外的乘数。行14上的乘数是由这个过程找到的头16个乘数中 

最 好的； 它是从68得到的四个中的一个。 

12. U- - U) - Uj - U s +2T Jl ^ J q i (U l * R) + Sa E k ^ jqi q k (Ur O k ) 0 关于 q k 

的偏导数是 (26) 左边的两倍。如果可以达到极小值，则这些偏导数必须全部消失。 

13 . U 11 = 1，以21 = 无理数 ，以 12 =以 22— 0。 

14 . 在执行了欧几里得算法三步之后，我们求得4 = 5 2 十5 2 ， 则 S 4 产生 


r - 5 

U = - 18 

^ 1 




r- 2 

18 

38 1 

V = 

- 5 

- 5 

- 5 


L 0 

0 

100 ^ 


通过变换 （ j ， <? 2 ，仍） = ( 1 , ^ , 0 , 2 ),( 2 , - 4 , 


U = 







- 2 


2、 


一 7 


,V = 



-22 
- 5 
9 


* , 1 ),( 3 , 0 , 0 , * ) ，（1， * ，0 , 0)得到 
- 2 18 ] 

- 5 - 5 , Z - ( 0 , 0 , 1 ) 

- 31 29」 


于是这我们由习题3已经知道。 

15. (11) 中可达到的最大的(?，减去可达到的最小者，加1，是1^1 +…+ I ^1 - 
S ,其中，对于某个 i 和 j ,若 w < 0，则5 = 1，否则8 = 0。例如如果 if = 5， w . 1〉0， 
w 2 >0， u 3 >0,； u 4 = 0 和 w 5 <0, 则可达到的最大值是 q = Ui + U 2 + U 2 ~ 1且最小值 

是 （？ = w 5 + l = 一 I u 5 \ 十 1。 

[注意，当 c 改变时，超平面的个数不变，因此同样的答案可应用于覆盖^而不 
是覆盖 L Q 的问题。但是，所述公式对于覆盖 k 不总是精确的，因为同单位超立方 

体相交的超平面不可能都包含 L g 的点。在上边的例子中，如果^1 + ^2+ u 3 > m , 

我们在 Lo 中总不能达到值 u x + u 2 + w 3 - 1;当且仅当在非负整数 Oi ，工2，工3， 

工 4 ) 中 m _ u v - u 2 - U^ - X X U X + X2U 2 + : r 3 w 3 十: r 4 I w 5 | 有一个解时它才是可达到 

的。当 | Wl | 十…十 |心| 为极小时，所述极限总是可达到的，这一点可能是真的，但并 
不显然。] 

16. 只须确定 （15) 的所有解有极小值 I ^ | +… +\u t \ ，如果这些解的任何一个 
有相反符号的分量，就减1。 
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我们不用正定二次型，而用颇为类似的函数/(&，•••，々）= l xlL/1 +…+ 

: T 从 I ，并定义 I YI = Ihl + …+ UI 。 不等式 （ 21 ) 可以用 I A I </(%，...，％)• 
(max^^^ I v kj I ) 代替。 

于是可以得到 一 ^ 个可用的算法如下。用“置 V^(l) y r < —l y s^—m 9 t 
—1” 代替步骤 S 1 到 S 3。（这里 L ； 和 V 是 1X1 矩阵； 于是二维的情况将用一般的 
方法来处理。当然可以使用〖=2的一个特殊 过程； 参见习题5的答案后面的参考 
文献。）在步骤 S 4 和 S 7 中，置 s — RI )。 在步骤 S 7 中，置义 — 

LmaxKjO | U / m 」 0 在步骤 S 9 中，置 — min ( | Y | _ 汐）；而在步骤 S 10 ，输出5 

= N l0 否则如它表示的那样，离开此算法，因为它已经产生了适当的短向量。[见 
Math. Comp. 29 (1975) ,827〜833。 ] 

17. 在 S 9 中 当々〉 z 时，如果 Y _ 就输出 Y 和-而且如果 Y - y < 5 , 

就收回对于这个 f 以前的向量输出。[就作者编制表 1 的经验而言，对于每个^恰 

有一个向量（及它的负），除非当 h = 0 或 3 ^ = 0 。] 

r 

18. a ) 设 x = m y y = (1 ~ m )/3, v- tJ = 3 ^ + xd {] , u {] = ~ y + 0 于是对于 j 年 k 、 

V 2 ’ • = 士 ( m 2 _ 1) ， VV = 吾 (m 2 + 士 )， A • Uj = ~j ( m 2 ^ 2) , z k ^ 

(这个例子对于 a = 1 满足 （28) 而且对所有 m 三 1 (modulo 3) 有效。） 

b ) 交换步骤 S 5 中 L ； 和 V 。对所有改变了值的 U ,， 置 mm ( s，LV R )。 例 

如，当 m =64, 对于 j = l 的这个变换可应用于 a ) 的矩阵，它把 



约简为 



r 43 

- 21 

- 2 b 


r 22 

21 

21 ) 

V = 

- 21 

43 

- 21 

, u = 

21 

22 

21 


L 21 

- 21 

43」 


[21 

21 

22 j 



V = - 21 

[-21 


43 - 21 

-21 43」 


r 22 21 21] 

U = - 1 1 0 

L - 1 0 


[由于这个变换可以增加％的长度，包含这两个变换的算法必须小心避免无穷 
循环，也见习题23。] 

19. 否。因为所有对角线外元素非负和所有对角线元素为1的非单位矩阵的积 
不可能是单位 矩阵。 

[然而，如果在% = W 时接着执行有 g = -1 的变换，循环将是可能 

的； 如果允许非缩短的变换，舍入规则必须是对符号非对称的。] 

20. 当 a mod 8 = 5 时，对于周期中 x 的点 2^( uU ) ，…，/卜 1 ] U )) 和对于 

0<： v <2 g — 2 的点2 2_ ， a (: y ) ，…， Y _ Vjy )) 加上 （mod 4)/2 e 相同，其中 a ( y ) ~ 
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( ay ^ lal 4 j ) mod 2〃 2 。所以在这种情况下，我们可以以772=2〃 2 使用算法3。 

当 a mod 8 = 3时，覆盖点 1 — e {工 ，5(: r ) ，…, 5^ ~ 1] ) modulo 1的平行超平面之间 

的极小距离和覆盖点 2〃（: r ， _ s (: r ), …，（- 1)^ 土 _ 1] U )) 的极大距离相同，因 
为坐标的负值不改变距离。后面的点是 2 2 〃（ 3Na ( 30 , …， V M ( 30 )， 其中 cy ( y ) 二 
(- 吋- 「 a /4 l)mod 2 e _2 , 加上一个常数偏离。再次对于爪=2〃 2 应用算法 S ， 把 a 
变成 m - a 对结果没有影响。 

21. X 4 „ + 4 = X 4rJ (modulo 4)，所以现在命 V \ = (4,4 a 2 ,4 a 3 )/772 , V 2 = (0,1,0), 
\^ 3 = (0,0，1)定义对应的格“是适当的。 

24.设 m = >， 可以给出类似于正文的分析。例如，当 t =4 时我们有 X „ + 3 = 

(( a 2 + b ) X n +i + abX n ) mod m ，而且我们要极小化 u \ + u \ + u \ + 使得 w + 

+ abu 4 = u 2 + aw 3 +( a 2 + 办) w 4 =0( modulo m ) 0 

用置 








— 2 


和输出 v 2 = m 的操作代替步骤 SI 到 S 3,用以下的8^代替步骤 S 4: 


S 4'. [推进 t 


如果，=丁，则算法结束。否则置 £ —Z + 1 和尺—只 f 



mod m 。 置 U t 成为 i 个元素的新行 （- r 12 , - r 22 ， 0 ，…， 0 ， 1 ) ， 而且对于1 

置0。置成为新行（0,…， 0， m )。 对于 l < i < 《，置 g — 

round ( ( v n r l2 + v i2 r 22 ) / m ) , v it ^ v n r 12 + v i2 r 12 - qm U t ^~ U t + qU {Q 

最后置 5^min (s ,U t ' U t ) y k^t ,j^l 0 

[一个类似的推广可应用于满足线性递推式 3.2.2-(8) 的长度为 p k ~ l 的所有 

序列。另外的数值例子已经由 A , Grube ， Zeitschrift fur angewandte Math , und 

/■ 

Mechanik 53 (1973)， T 223 〜 T 225 ; L ’ Ecuyer，Blouin 以及 Couture,ACM Trans . Mod ¬ 
eling and Comp . SimuL 3 (1993) ， 87 〜 98 给出。 _ 


25. 给定的和至多是量(说）=1 + 


^/ U “） 的两倍，其中 


/(m) 


m 



CSC 


(丌是/ 


m 


mj 2 


m 


m 


12 


csc(tcx/ m)dx + O 


1 


I 



In tan 




[当 d = 1 时 ，我们有，⑴ =(2/jc)ln m + 1 + (2/7T)ln(2e/ 丌）十 0(llm) 0 ] 

26 .当 m = l 时，我们不能用 （52)， 因为々将是0。如果 gcd ( g ， m ) = d ， 以 m/d 
代替 m 即可做同样的推导。假定我们有 m 二抑…於和 gcd(a - 1 ， m ) = p ['… f /， 


及 d = p d f p d “ 如果以 mid 代替 m ， 则 s 用户 5^ x (0 a -/〗-() …夕， x ( o ，〜 -/ r -〜） 代 
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27 ■使用下列函数是方便的 ：如果 ： c = 0，〆^) = 1,如果 0< x < ml 2， p ( x ) 二工， 
如果 ml 2〈 x 〈 m , p ( x ) = m _ :c; 如果 Q < x < ml 2 , trunc( x) = l_i/2」， 如果 m/2< 
x < m ? trunc( x ) = m ~ l(m - :r)/2」； 如果 x = 0 , L ( x ) = 0,如果 Q < x < ml 2 ， 
L ( x ) ~ Llgi 」+ 1，如果 m/2<jc< m y L ( x ) = _ (1_1§.(肌 _ 2)」+ 1);且 l ( x ) — max 

(1，2 m _1 ) 0 注意对于0<： ? ：<饥，/([(工））< ( 0(工）<2/(]：(工））且2 | 0( >3 ：)<1/，（工） 

如果向量（^ ，…， ^)非零且满足 （15)， 就说它是坏的，并设 p min 是在所有坏的 
(心 ，…， ⑷）上 〆 &)•■• 〆 〜）的极小值。称向量（^， …， W ;) 是在类 （ L(W !)，•..， 
L ( uJ ) 中。因此至多有 （21 gm + 1) ; 个类，而且类 （ Im ， …， 至多含 ULO … 
/( b ) 个向量。我们的证明是基于说明在每个固定的类中的坏向量仅对 Sr ( Wl ， 
…，^)贡献至多2//0_;这就证明了所要求的上限，因为 lM _</ r max 。 

命 p = Llg ^ mi Jo 一个向量上的 p 重截断运算符定义为下列运算重复执行" 
次：“命 j 是使得 p ( uj ) > 1的极小值，并以 trunc ( w ; ) 代替;但如果对于所有 j ， 
/0( W ;) = 1， 就什么也不做。”（此运算实质上是拋掉与 Ui ，…，^)有关的一位信息。) 
如果，…， 〆 ）和 （ z / i ， …， <) 是有相同的"重截断的同一类的两个向量，我们说 

它们是相似的；在这种情况下得出 p(u \ - u " i ) … f }( u : - u [) < 2^^ ( o min 0 例如当 m 

■ 

很大和 P = 5 时，形如 （（ljr〗：!：！）〗，。，/?! - (1工 3 ) 2 ，（ 101^5^4 )2 ，（ 1101 )2) 的任何两个 
向量是相似 的；" 重截断运算符逐个地删除：^，2 2 ，：1： 3 ，工 4 ，：^。由于两个坏向量的 
差满足（15)，因此两个不相等的坏向量不可能是相似的。因此类 （Li ，…， M 至多 
可包含 — 个坏向量。如果类 （M ，…， 恰含一个坏向量 

( …，…，仏 ） ，我们有 r ( , W, X 如果它包含 (1 ( L i) … I ( L t ) j 2 M 

个坏向量，它们每一个都有 r ( u '， …， u t Xll p ( u ') … p ( u L Xll l ( L ') … L ( L t ) ，极 
此我们有1/2^ <2/^,0 

28. 设？ = 并设知= （51) 的类似是 LSkJ = “， 

因此与 （53) 类似的式子是 IN- 1 2 =0((7^ logm )/ N ) 0 类似的定理则表 

0^ n<N 

述为 :0( “ (1 $ m ” + 1 )+ 0( (log m)V max ),Di J °- l = 0( (log m)V max ) 0 
事实上， … ，义）[对 （15) 的非零解求和]+ ，…， 

m - I m - 1 

w,) [对所有非零的 （& ，…，乂）求和]。由习题25和 d = l， 后边的和是 0( log m ) L y 
而前一个和与 27 题同样处理。 

我们现在考虑量 R ( a )= 2] r( Wl ，…， ^) ， 这里是对 （15) 的非零解求和。由于 
m 是素数，对每个（^ ，…， &) ， 至多有 f-1 个 a 的值可以使它是 （15) 的一个解，因 

此 SocaCrJ^ (a X(卜 ，…， it ,) 二 0( Z( log m ) L ) 0 由此得出，取遍所有 

( p(m -1) 个原根的 _R(a) 的平均值是 0( 纟 （log m ) 1 1 < p(m - 1))。 


注：一般来说，1 / pw ) = 0 (log log 72/ n ); 我们因此证明了对于所有素数 m 和 
对所有 T ，存在一个模 m 下的原根 a 使得线性同余序列 ( 1， a ，0 ， m ) 有差异 D ( ?_ != 

0( m - l T(log m ) T log log m )， l « T 。 这个证明的方法不能推广到周期为模 
2 e 的线性同余生成程序的类似结果上，因为例如向量（1，-3,3, - 1) 对几乎2~ 3 个 
a 的值是 （15) 的解。 

29. 为了获得一个上限，允许 W 二“ i ，…，仏）的非零分量是的 

任何实值。如果6个分量为非零，利用习题27的答案的符号，我们有 r (^)< 
l /(2 V ( w ))。 而且如果…+ 有一个给定的值 W 2 , 通过取…和 

u \ — V 1 - k \ 我们极小化 ( U ) 。因此 r(W )^1/2^ \ fv 2 - 々+ lo 但是由于 

々>2,因此有 M s / v 1 _ k + \ o 

30. 对 < m 和 （X p < a 极小化 g I 叫 - m /? I 。利用习题 4 • 5 • 3-42 的记 
法，对于 0< n <5 我们有 - mp n = ( - 1) n K s ~ „_1('+2,…，〜）。在 

q n 的范围内，我们有 I aq - mp \ ^ | aq n - 1 - mp n _ i | ;因此 q \ aq ~ mp \ ^ q n -\_ * 
aQn ~\~ rnp n - x I ，且极小值是 min 0 ^ n < s q ri I aq n — mp n I = min 0 ^ n < s K n ( a { , …， 〜）. 

— (〜+ 2, …， 〜）。由习题 4.5. 3~32 5 我们有 m = iC w ( q ，…， 〜） 十！ & _ 刃 一! 

+ 2 ， •• •，^ ^) + ]<” ( ai ， •”， n — 2 ( a „ + 3 ， ••• ， o 5 ) + K fl ^ { ( a [y -- y a n ^ x ) K s ^ n - { 

(〜 + 2 ，…，〜） ； 而且我们的问题实质上是使量 m / X „ ( ai , , a „ ) K s _ n + 2 » 

aj 达到 极大； 它位于 a tl + i m a ” + l + 2 之间。 

现在设 A = max ( a x , a s ) o 由于 r(m ~ u ) = r ( w ), 对于 的某 

个 w ，我们可以假定 r max = r ( u ) r ( au mod m ) 0 置 u ’ = min ( au mod 7/2,( - au ) 

mod m )， 我们有 r max = r ( u ) r ( u ) o 从上 一 段我们知道其中 A /m ^1/ 

qq^iA + 2)/ m 。 其次对于 0< 所以 r max < 1/ 

(4 w ?/)。 因此我们有 r max < ( A + 2)/(4 m )。（有一个类似的下限，即 r max > A / 

(丌 2 m ) 。 ） 

31. 等价地，猜测如下 •.对 于某个^和某个丨1，2,3|,所有很大的 m 都可写 

成772 =尺„(以，…， 〜）。 对于固定的 n ，3” 个数1(化，〜，〜）有阶为 （ l +/ ir 的 
平均值，而且它们的标准差的阶为 （2.51527)” ；所以这个猜测几乎肯定是对的。 S . 

K . Zaremba 于1972年猜测所有的 m 都可用 a ,. <5来表示； T . W . Cusick 在 Mathe - 

matika 24 (1977) ，166〜172中关于这个问题做了某些推进。看来只有 w = 54和 t/z 
=150的情况要求屮= 5,而且要求 a t ^4 的最大的 m 是2052,2370，5052和6234； 

至少作者已经发现了对于小于2000000的所有其它整数的的表示。当我们 

要求屮<2时 ，I (〜，…，〜）的平均值是音^ +含 （- 2)-' 同时标准差随 
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习题答案 


(2.04033 广而增长。依作者的经验这样的数的密度（对于 m <2 2G ， 它考虑每块有 
2 14 个数的2 6 块），看来是在 .50 和 .65 之间变化。 

[关于求具有小的部分商的乘数的一个计算方法，请见 l . Borosh 及 H . Niederre _ 
iter,£/T 25 (1980) ，193〜208。他们已经求出对于 25< e <35 的且有 m = 2 e 的2 
有界的解。] 

32 . a ) U n ~ Z n I m [ = ( m2 ~ ttl ^) Y„j mi ( modulo 1)， 以及 ~ 7 ^ 2 ) / m i m 2 

〜 2_ 54 。 （因此我们通过分析可以分析 Z „ 的高阶二进位。低阶二进位大概也是 
随机的，但是这个论证对它们不适用。） b ) 对于所有的 n 我们有 Wjm 。 中国 
剩余定理告诉我们只须验证同余 2 (modulo 和三 - modulo 

772 2 )，因为 丄 m 2 。[Pierre L’Ecuyer 和 Shu Tezuka ， Math . Comp . 57(1991)，735 

〜 746。] 

a 

3.4.1 小节 

1. a + a ) U 。 

2 . 设 U = X/m ; 则 L 々 L 7」=< r + m ( 厂 + 1)/ 

mr /^ KX<r m(r + 1)/々"|。精确的概率是由公式 （1 /m ) ( 「 m(r + 1)/^1 - 

mr l ^ 1) — l /^ + ( 给出，其中 I f I < 1/ m 。 

3. 如果给定全字长的随机数，则结果将如在习题 2 中那样，至多偏离正确分布 
1/ m ; 但是所有余量都给予最小的结果。因此，如果 m /3 ，则结果有大约2/3的 
时间小于々/2。如果则通过拒绝 U 得到一个一致均匀的分布会是好 

得多的；参见 D . E . Knuth,The Stanford GraphBase (New York ： ACM Press , 1994), 

221 0 

另一 ^ 方面，由 3.2.1.1 小节的结果，如果使用一^个线性同余序列，々必须同模数 
m 互素，以免诸数有一个很短的周期。例如，如果&=2和771是偶数，则这些数最好 
将是0和1的交替。这个方法在几乎每一种情况下都是比 （1) 慢的，所以不予推 

荐。 

然而不幸的是，在许多高级语言中都不支持 （1) 中的“ himult (高位乘法） ，，运算。 
参见习题3.2.1.1-3。当高位乘法不可利用时，以来做除法可能是最好的。 

4. max ( X !, X 2 )^ x 当且仅 c 和当且仅当 

>• 2 ■和 X 2 > x 。 两个独立的事件都发生的概率是各个概率的乘积。 

5. 得到独立的一致离差％和（7 2 。置 X — U 2 。 如果 纪则置 X —max 

( X ,(7 3 )， 其中 I 7 3 是第三个一致离差。如果 + ^ 则也置 X —( X ， L 7 4 )， 其中 

U 4 是第四个一致离差。这个方法显然可推广到任何多项式，而其实甚至可推广到 

无穷幂级数（如同在算法 S 中作为例子说明的，它使用极小化而不是用极大化）。 

我们也可以这样做 （ M . D . MacLaren 提出的）：如果 R < p ,则置 X — R/p ;否 

则如果 + g ， 则置 X —maxUR _/>)/心 ％);否则置 X ^ maxUU , — p - 
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3.4.1 小节 


q ) lr ， U 2 ， lh )。 用这个方法求一致离差所需的时间比 

其它方法少，缺点是有一些额外的算术操作而且数值 
上稍微不太稳定。 

6. FU ) = A 2 )， 其中 Ai 和 A 2 是图 A - 

4中的 面积； 所以 


F(x) 



-arcsin x + 

丌 


2 


X 


TT 


/i 




X 



每次遇到步骤 2 时，在步骤 2 中终止的概率是/ > = tt /4, 
所以执行步骤2的次数服从几何分布。由习题17知， 

这个数的特征是 （min 1, ave 4/ rr , max 00 , dev ( 4/ tt ) • 



图 A -4 习题 6 的算 
法的“承认”区域 


\/l - 7 t/ 4 ) o 

7. 如果々 = 1,则 n x ^ n 且问题是平凡的。否则总有可能找到使得 
用〜 个颜色的立体和 n - ‘个颜色 q 的立体填私，然后〜减少72 -义， 

并消去颜色 Q。 余下的问题与原来一样，只是 A 的值减了 1;由归纳法知它是可能 
的。 

下列算法可以用来计算 p 和 Y 表 格：构 造数偶（乂，1) … （九，々）的一个表并按 
头一个分量对它进行排序，得到 一 个表 （A ， ^ ) … （w q ) ， 其中 … < q k 。 置 n 

—k ;重复下列操作直到7?=0:置 — ⑼和—删去（1， 

n 

〜）和（〜，〜），然后插入新的项 -（iM - w)，〜） 到表中的适当位置上，并且 n 
减1。 

(如果朽 < iM， 则这个算法将不把' 放进 Y 表 格中； 算法 M 中隐含地用到了 

这一事实。这个算法总是剥夺最富裕的剩余元素并把它给予最穷的元素，以使 （3) 
中 V<P K 的概率达到极大。但是，确定这个概率的绝对极小值却非常困难，因为这 

样一个任务至少像“装箱问题”一 样难; 参考 7.9 节。） 

8. 对于用 G + 代替巧。 

9 . 考虑 f \ x ) — \/ 2/：r(x 2 - 1 )e~ x &的符号。 

10. 设对于 S ; = G — 1)/5 和对于 1<』<15，巧 + 15 = F ( S ; + 1 ) - 

F ( S 」）_ 岛; 还设如 = 1- F ⑶和 p 3 2=0 o (等式 （15) 定义以，…，户 15 。）对于 A = 
32,习题7的算法可用来计 算巧和 I 。在这以后，对于1< ; <32,我们将有 
<15。置 P 。— P 32 (它为 0), 且 y 32 。 然后对于0< ; <32,置 Z ; — l /(5-5 G ) 

和 V ,—对于 令 Q 7 -1/(5P ; ) 0 


设 A = ^■且对于 S 7 < x < S ; + h 设力 + 15 (工 ） 二 >/2 U ( e~ x 12 - e~ J /50 )/ p ; + 15o 然 
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题答案 


后对于设 〜 =力 + 15 ($)，对于令以及对于 1 <； 

<5,令匕= — hf ] + 15 ( + / z ) ，还有对于 6< j <15, 令〜=力 + 15 (弋）十（:^ - S ^ bj ! 

A ，其中 a 是方程 fj + xsixj ) = - bj/h 的根。最后对于 l < j <15, 置 D J + l5 — ajlb ” 

和对于 置 E , + 15 — 25"，对于6<)<15,置乓 + 15 — l /( e ( 2 r 1 )/ 5 °- l )。 

在计算表1时用到了下列的中间值 ：（& ，…， p 31 ) = (.156, .147, .133, .116, 

• 097, .078, .060, .044, .032, .022, .014, .009, .005, .003, .002, .002, .005, .007, 
.009,.010,.009,.009,.008,.006,.005,.004,.002, .002, .001，.001， .003);(工 6 , 

••• , x 15 ) = (1.115,1.304,1.502,1.700,1.899,2.099,2.298,2.497,2.697,2.896); 

,--*, a 15 ) = (7.5,9.1,9.5,9.8,9.9,10.0,10.0,10.1, 10.1, 10.1,10.1,10.2, 
10.2,10.2,10.2)； (^!，= (14.9,11.7,10.9,10.4,10.1,10.1,10.2,10.3, 

10. 4, 10. 5, 10. 6 , 10. 7, 10. 7, 10. 8 , 10.9 )o 

11. 设对于 = e 9 / 2 re ^ /2 。由于 G ( x ) - g ( t)dt = 1 - 已七、 9 、 11 ， 

^ 3 

通过置 X — G [ m ] ( 1 - V ) = 79 - 2 In V 可以计算具有密度 g 的一个随机变量 X 。 

现在对于 r >3， e 〃 2 / 2 <( r /3) e — ^ 2 ,所以如果以概率/( X )/叹（ X ) = 3/ X 接受 X ，我 
们就得到一个正确的拒绝的方法。 

12 . 对于 我们有 f ( x ) = xf ( x ) - 1 < 0 ,因为对于 x > 0 ,/( x ) = 

2 r °° 2 

x~ l ~ e x e~ c "(^" 2 。设：?： = Uj-y 和 ； y 2 = x 1 + 2 \n 2 ; 则 

^ X 

72/^1 e~ t2 ' 2 dt = j y 2 Ue ~^ /2 f ( y ) < j ~ - ^ 11 f { x ) = 2 ~ ; 

因此 : y > ~ 。 

13 . 取~ =巧；现在考虑对于每个= 0 的问题。在矩阵表示下，如果 Y = 
AX ， 其中 A = (%)， 则我们需要 AA T = C = (^)o (在另外的记法下，如果 K = 
s a Jk x k , m y , y ; 的平均值是如果这个矩阵方程对 A 可解，则当 A 是三角 
矩阵时，它可以求解，因为对于某个正交矩阵 L ； 和某个三角矩阵 B，A = BL 7, 且 

= C 。通过逐次地对 a 11 ， a2i ， a 22 ， a 31 ， < 232 等解方程 = c ^ , <2 ^ <221 = ^12 » ^21 

+ a 22 = c 22 ^ a n a 3 l = c 13 ， a 21 a 31 + a 22 a 32 = C 23 ，…，所求的二角形解可以得到。[注: 

协方差矩阵必定是半正定的，因为 （ SmK ) 2 的平均值是 Scwa ， 它必定是非负的。 
而且当 C 是半正定时，总有一个解，因为 C = U - MiagUi ，…， A „) L /， 其中特征值~ 

是非负的，而且 L 7 1 diag (〜 ，…， ) L 7 是 一 ^个解。] 

14. 如果 c >0, 则 FU / c ); 如果 c = 0, 则为一个阶梯函数[: c >0] ; 而若 c <0, 
则为 1- F ( xlc )。 

CO ^ QO 

15. 分布 F,{x - () cLF 2 (0。 密度 Mx - d / 2 U ) dr 。 这叫做诸给定分布 

^ — OO J — OO 
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的卷积。 


3.4.1 小节 


16. 显然，如同所要求的那样，对于所有 t y f ( t ) < cg ( i )。 由于 g ( t)dt = 1, 

^ 0 

对于 0< Z < 1，我们有 gU ) = Cf 1 ， 对于，>1它等于 Ce ' 其中 C = ael(a + 
e )。 具有密度 g 的一个随机变量容易作为两个分布的一个混合而得到，即对于0 < 

x < \ y G x ( x ) - x a 和对于: r > l ， G 2 (： c ) = 1 - e 1 ~ ^ ： 

G 1 •[初始化] 置 p — el ( a + e )。 (这是 Q 应当被使用的概率。） 

G 2 .[生成 G 离差]生成独立的一致离差卩和 V ，其中 V ^ Oo 如果 U < p , 

则置 X — e — x ; 否则置 X^l - InV 和 g —Y — 、（现在 X 有密 

度貧，而且 g = /( X )/ cg ( X )。） 

G 3 .[拒绝？]生成一个新的一致离差 U 。 如果则返回 G 2。 ■ 

迭代的平均次数是 c = U + e )/( er “ + 1))<1.4。 

有好几种方法可把这个过程流水线化。首先，我们可以用比如说由算法 S 生成 
的均值为1的一个指数离差 Y 代替 V ，而后在两种情况下，我们置 X — 或 X — 
1+ Y 。 而且，如果在头一种情况下我们置 g — ，在第二种情况下置 q — P + 
(1- / OX ^ 1 ， 我们可以使用原来的卩而不是用步骤 G 3 中新生成的那个 L /。 最后， 
如果 ！7< p / e ， 则我们可以立即接受 V 1/ a ，而避免大约30%的对 g 的计算。 

17 ‘ （ a ) 对 x^O y F ( jo ) — 1 - (1 - p ) U 。（ b ) G ( z ) = pzj { \ ~ (1 _ p ) z ) o ( c ) 

均值 1/ p ， 标准差- pi p 。 为了算出后者，注意如果 H { z ) = q + (I ~ 则 
⑴ = l_q * ir ( l ) + fr ( l )-( ir ( l )) 2 =^( l - g)，KW 1/ HU ) 的均值和方差 

分别为 g -1 和（见 1.2.10 小节。）在这种情况下 ， g = 在 GU ) 的分 
子中额外的因子2：使均值增加1。 

18. 置 N ^ N l + N 2 - 1,其中和 iV 2 独立地有概率为 f 的几何分布（考虑生 

成函数）。 _ 

19. 置 iV — % +…+况_〖，其中 iV , 对于 P 有几何分布。（当进行一系列独立 

的试验时，每个试验成功的概率为/>，这是在第 f 次成功之前失败的次数。） 

对于 r = p = 而且一般地当这个分布的均值（即 〆 1 _户）/户）很小时，我们可 

/ I 一 1 + 72 \ 

以像在下列算法中那样对于 n =0， l ，2, …连续地计算概率 p n 二 ^(1- 

\ / 

PY ' 

B 1. [初始化]置 N —0 ，g — 并生成一个随机的一致离差 L /。 （在巧 

算法运行期间我们将有 g = f / v 和「=如+…+ p N ， 只要 U < r 它就停 

止。） 

B 2. [迭代]如果 ，则置 N — N + 1，(? — g(l _ + N)lN , r^r + 

g ，并重复这一步。否则返回 N 并结束。 ■ 

[ R . L 6 ger 已经提出对于任意大的实数值，对于负的二项式分布的一项有趣的 
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题答案 


技术： 首先生成阶为 
个随机泊松离差。] 


的一个随机 r 离差X，然后令 N 是均值为 x(i-/O/p 的一 


20. R1 


1 + (1 - A/R)*R1。 当执行 R2 时，算法以概率7/尺 终止； 当执行 R3 


时，它以概率 EIR 转向 R1。 我们有 


R1 

RlA 

RlA 

RlA 

RlA 

R2 

0 

RlA 

0 

RlA 

R3 

0 

0 

RlA 

RlA - IIA 

R4 

RlA 

RlA - IIA 

RlA - ElA 

RlA - Ua 


2U 


^/We^l. 71553; A 


V 丌/2〜1 • 25331。由于 


u 


a — bu du 


a — bn ) 3 ^ 2 


2 , … 2 





(a — bu ) - 





b 


我们有 J 


alb 


4 


u 


a — hudu ~ -rza 5 ^ 2 /6 2 , 其中 a = 4(1 +in c)，6 


15 




4 c ; 当 c = e 



时， J 有它的最大值 




13020。最后对于 £ 需要下列的积分 公式: 


bu — au 2 du 







b 


一 


3 ^ 2 arcsin(2wa/6 - 1) 





4 


ha 


— i 


bu 


au 2 ( 2 ua/b — 1 ) 


bu + au du 




8 


b 2 a ~ 312 


ln( 


bu + au 



u 4 a 



6/2 v^) 



4 


ba 


-l 


bu + au 2 (2 uaIb 



1) 


其中 a y h > 0 o 设步骤 R3 中的检验是“又 2 >4# _1 /1/-4:?: 


则当 u 




r 


O) = (e 


- lex)ilex 时外部区域碰到矩形的顶部。（恰好， rU) 在 


X 


1/2处达到它的 


极大值，这是它不可微的点！）我们有£： 


r{x) 


e — bu ~ au 1 )du ，其中办 


4 e x ~ l , a - 4:c。 在靠近 ：c 


.35 处出现 E 的极大值，在此处我们有£〜.29410。 


22. (G.Marsaglia 给出的解）考虑对于： r >0时由 G ( 


X 


x^\ 


/ r ( x 


所定义的“连续泊松分 布”; 如果X有这个分布，则 LX」 服从泊松分布，因为 G(x 



G ( x ) = e 一 


/ x ! 


如果"很大， G 就是近似于正态的，因此 G [ ~ 1 \ F m ( x )) 近 


似于线性的，其中 


是具有均值和方差 


的一个正态离差的分布 函数； 即 


F ^( x ) 


F(( 


X 


")//；；)，其中 F { x ) 是正态分布函数（10)。设 g-(^) 是一个有效 


地可计算的函数，使得对于- oo 


oo 


G[ _1] (_F" (: r)) - g ( x ) I < 我们现 


在有效地生成泊松离差 如下： 生成一正态离差X，并置 Y 


g (^ 







LYJ,M 


^ — 


y + 




2 


则如果 


Y - M 


> 


，就输岀 N ，否则输出 M 
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3,4.1 小节 


； G [ - 1] ( F ( X )) < M ] 0 

这个方法也可应用于二项分布，且 


G(x) 


A 


u 


x 


1 


(1 - 


u 


n - x 


d 


u 


r( 



l ) 


p 


r( x ) r( t + l _ jc 


因为 LG 


[-1] 


(以）」是具有参数（〖，/0的二项分布，6近似于正态的。 


[还请参见 Ahrens 和 Dieter 在 Computing 25 (1980) ，193〜208 所提出的另 


个 


方法 


o 


23•是。第二个方法计算 | cos 20|，其中 <9是在0与 W 2 之间一致分布的。（设 


U 


r cos Q , V 


r 


sin 6 


25. 


21 

32 


.10101)2。 一 般来说，通过从左到右地用 1 代表 V ，0代表 A ，最后添 


一 ^个 1，来形成 一 进表 7K 。 这项技术[参考 K . D . Tocher ,/. Roy. Stat. Soc. B-16 
(1954)，49] 可导致有效地生成有一个给定概率 p 的独立二进位序列，而且它也可应 
用于几何分布及二项分布。 

26. ( a ) 真 + （ b ) 假，除 

非 "2=0; 否则 - iV 2 可以是负的。 

27. 设 f 的二进表示是 （ .心心心…） 2 ,并按照下列规则进行 计算： 

B1. [初始化] 置 m — t ， N — Q，j — U (在此算法运行期间， m 表示模拟的一 

致离差的个数，它们同 A 的关系仍然未知，因为它们在其前导 j - l 位同 p 
匹配； 而 N 是已知的小于 p 的模拟离差个数。） 


B2. [寻找下一列二进位]生成具有二项分布(772，^^的随机整数 A 1。 （现在 

M 表示不能匹配~的未知离差的个数。）置 m — m - M ， 而且如果^ = 1, 
置 N—N + M 。 

B3. [完成没有？]如果772=0或如果 p 的剩下的二进位 + …） 2 全为 

零，则算法终止。否则，置 J + 1 并返回步骤 B 2。 ■ 

[当对于无穷多的 h 匕 =1时，平均的迭代数满足 



设 A(z) = YuA n z n j n ! ， 我们有 A{z) ~ e z ~ 1 + A 



e W2 。 因此 A ( z ) e —' = 1 — 


e 


z 


+ A 


1 




2 


2 ： 


e 


一 zj2 — 


E 


k>0 


(1 


-e— zl2 




n^l 


- z) n Kn\ ⑵ —1))， 且 


在习题 5 . 2 . 2 — 48 的记法 mi ⑵ # = 1 + ^ = h + 6 + i 

十 / o (”）+ 0{ n ^ l ) 0 _ 


28. 在单位球上生成一随机点 （％， …， X )， 并设 P = 生成一独立的 


•551 • 


习题答案 


一 致离差卩，而且如果 ， + 1 U<K 则输出点 bi /心 …，％心）；否则开始 

跳岀。这里如果似 72 > a L 则 K 2 = mini ( T > a ^]) 71 + 1 1 ( H a\y \ ) \ Y^yl = 11 = ，否 

则为 （（n + 1)/((^ + )) " + 1 ( a { a } J n) n o 

29 .设 又 + 1 = 1，然后对々 = 77 , 72 _ 1，…， 1 置 X k — X k + ' U [ k lk 或 & —& + 1 • 

e ^ y ( M ， 其中 r 是一致的或 是指数的。[见 ACM Trans . Math ‘ Software 6 

(1980) ， 359 〜364。这 一 技术是由 David Seneschol 于20世纪60年代引进的；请见 
Amer . St^stidan 26,4(1972 年10月），56〜57。生成”个一致的数并对它们排序 
的另一个方法大概更快，用的是一个适当的排序方法。但如果只要求一些最大或最 
小的 X ，则这里所建议的方法是特别有价值的。注意…， F [ ~ 1] ( XJ ) 


将是被排序的有分布 F 的离差。] 

30. 生成随机数 Zi = -/ i _ I lnU 2 ，…，直到 Z 7W + i > l 0 对于 

l < j<m 输出（4, K ) = /( Z ; ) ，其中 /((. 幻卜… b 2r ) 2 ) = ((. … M 2 , 

(.~ + 1 ~ + 2 …心,) 2 )。如果较低有效位是比更高有效位要非随机得多的，则令 

/( ( ■ b \ b 2 … b 2 r 、2) = (( ‘ 心3…心 2 r - [ )2 ， （ ■ … h r )2) 是更安全的（但也更慢）。 

31. a ) 只须考虑々=2的情况，因为当 X = X I ,cos 0 =〜，以及 Y = U 2 X 2 + … 

+ a ^ K k )1 sin 6 时， a ! + …+ a k X k — Xcos 0 + Y sin 0，而且由替换 w = «scos 夕十 

t sin 0 , v — — s sin d 十 t cos 夕，得到 


Pr(Xcos d + Y sin d ^ x) 





5 cos 



+ it sin d ^ x _ 


2tt 


e 


u \ l-V 


l2 dud 


V 


u 


< 


X 




( 10 ) 


u . v 


b ) 有数 a > l 和 /3>1 使得 U _24 +， 55 )/W = l 和音 f 24 + 音厂 55 = 1; 所以由 


线性递推的性质，数将随 n 而指数地增长。 

如果我们通过比如说使用递推式 X , = X„- 24 cos ^ + X ,_ 55 sin 化，其中^是在 

[0,2 tt ) 中一致地选择的，来破坏线性递推的模型，我们大概将得到还不错的 结果； 但 
这一方法将涉及多得多的计算。 

c ) 比方说，通过2048个正态偏离 X 0 ,***, X 1023 ， Yo ，…，开始，在使用了它 

们中的1/3之后，生成另外2048个如下 :在 [0，1024)中一致地生成 a ，6， c 和 d ， 且 a 
和 c 为奇数，然后对于0<_；<1024,置 

X J 一 ^(aj + b) mod 1024 cos ^ + ^ (cj^-d) mod 1024 s ^ n ^ 

^ j ^ (aj ^ b) mod 1024Sin 汐 + ^ ( cj + ^ ) mod 1024 COS 沒 

其中 cos 0 和 sin e 如同在习题 23 中那样选择，是 （ L ； 2 - V 2 )/([/ 2 + V 2 )和 2 UV / 

( U 2 + V 2 )的随机比。除非 kos 和 Isin 剠>士，否则我们可以拒绝 L 7 和 V 。 

2048个新的离差现在代替旧的离差。注意对于每个新的离差只需要少量运算。 
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3.4.2 小节 


这个方法不像在 b ) 中所考虑的序列那样发散，因为平方和 s ($ + y , 2 ) - 

S (($) 2 +( y ；) 2 ) 保留常数值 S 〜2048,除非有一点舍入误差。另一方面， s 的常 

数性实际上是这个方法的一个缺陷，因为平方和实际上应有2048个自由度的；分 
布。为了克服这个问题，实质上分派给用户的正态离差不应是4而是 aXj ， 其中 


a 2 = j ( Y l023 + /4095 ) 2 IS 是一个预先计算的比例因子。（量 + ( Yi Q23 + v ^5) 2 


将是所要求的 f 离差的一个合理近似。） 

参考文献： C . S . Wallace [ACM Trans , on Math . Software 22( 1996) , 119 〜 127 ]; 
R . P . Brent [Lecture Notes in Comp . Sci . 1470 (1998) ， 1 〜 20] 。 

32. a ) 映射（ X 、 Y /)=/( X ， Y ) 是从集合到它本身的一对一的对应， 
使得 2 + 3 / = :?: +》和 d / d / = dxd . y ，我们有 



mod 1， 


r 

x / + y / ~ 


/ y 

x + Y 



mod 1 


b ) 这个映射是一个二对一的对应使得 + + y 和 d ^： / d 3； / =2 dxd^o 

c ) 只须 考虑勹 拍” 转换： 对于一个固定的整数 j ， 


X' = (…： 广 2 ： y ; _ 3 … ） 2 

y ' = (…:^+2为 + 13^广1工广2工广3...)2 


然后对于户 o ， i ， -1,2,-2, …组成 j 拍，注意当 id— ⑺时的联合概率分 
布收敛。每个 j 拍是 一 对 一 的，且 ： c +y si 十》和 dx d ^' = dxd ； y 。 

33. 使用 R 作为另一个随机数生成程序（也许是带有不同的乘数的一个线性 
同余生成程序）的 种子; 从中取 U 2 ， U 3 ，…。 


3_4.2小节 


1 . 从最后的 N - i 个记录取出其中的 72- m 个有种 方式； 在选择了第 

\ n ~ m } 

Z + 1项后，从 iV - Z - 1个记录取其中的 n - w - 1个有 P 1 1 ) 种方式。 

\n ~ m ~ 1 / 

2. 当有待考察的记录数等于 n - m 时，步骤 S 3 将不会转到步骤 S 5。 

3. 我们不应混淆“条件的”和“无条件的”概率。量 m 随机地依赖于在头 f 个元 
素当中发生的那些 选择； 如果对于所有可能的选择（它们可能已在这些元素当中出 
现）取平均，则我们将发现平均来说 U _ m )/( iV - 0恰好是 nlN 。 例如，考虑第二 
个元素。如果在抽样中选择头一个元素（这出现的概率为 WiV )， 则选择第二个元素 
的概率为 - l )/(/ V - l )。 如果不选择第一个元素，则选择第二个元素的概率是 
W ( N - l )。 选择第二个元素的整个概率是 U / N)(U -1)/( N -1)) + (1- n / N ) 

( nl ( N -1)) = nlN 。 

4. 由算法可知 
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题答案 



p(m yt + 1 ) 




1 n - m \ y x i n - (m - 1) ( i 、 

1 — — _ t 十 一 ^ r~ t — pirn - 1,0 


通过对 


用归纳法，可以证明所求的公式。特别是 p ( n y N ) 




1。 



. 在习题4的记法下，算法结束时 



的概率是 W 




p(n yk) - p(n yk - \ ) 


k - 1 

n — 1 


N 


平均值为 s 厂 


n 


^Qk 


(N 十 l ) n/(n + 1) 0 


6. 类似地， 2 二十 l)w 




(N + 2 )(N + l ) n/(n + 2); 因此方差是 （N + !_)• 


(N - n ) nl (n + 2) ( n + 1 ) 2 0 


假设选择是 1< 


x 


< < 


< No 设： T 0 


0, x n + \ = N + 1。以概 


率 p 


得到此选择，其中 
(N - (t - 1) 


n 



m 


Pt 


N - {t - l) 


，其中 ；< 


< 工 m + l 


n 


m 


N - (t - 1) 


，其中 




乘积 p 的分母为 AM , 对于不是： r 的那些〖，分子包含项 N - n ， N _ n - 1, 


#嘐 ■ 


’1，对 


于是 x 的那些〖，它包含项 n ， n-l ， 




，1。因此夕 


( N — n)\ n \ IN \ o 例子： n 


3 y N 


8, ( , j ： 2 , x 3 ) = (2,3,7) ；p 


5 3 2 4 3 2 






8 7 6 5 4 3 2 


8 • a ) p(0 y k) 


N - k 


n 


X N ) 的抽样 Mr ： 72 

n ! \n I \ k 


n 


N 

k 


省略头々个记 


录 o 


b ) 置 X—k - 1，其中 A 是使的极小值。因此，以 X 


n ， q—N，R — plq 开始，而当 U<R 时置 X —X + 1，夕 


P 


1 . Q 


^ — 


一0， p 如 

q - lyR 


N 


Rplqo (当 n / iV 是，比如说大于等于 



时这个方法是好的。我们可以假设 WiV < l / 


2;否则最好选择 N - n 个未 抽样的 项。) 


c ) Pr ( min ( Y N ，…， Y N . n + 1 ) > 々） = nJlJPr ( Y n —j ^ k ) = 1^:1( N ~ j ~ 

k ) l(N - 7 )。 （如果，比如说 ， n < 5,这个方法是好的。） 

d ) (参见习题3.4.1-29。）值 X ^ LN (1- U 1/ rj )」 需要以仅仅 0( n / iV ) 的概率 
被拒绝。精确的细节在 CACM 27 (1984),703 〜718中被仔细地给出。而一个实用 
的实现出现在 ACM Trans . Math . Software 13 (1987) ，58〜67上。（当比如说 5 <n 

< N /5 时，这个方法是好的。） 

在跳过 X 个记录并且选择下一个之后，我们置 n^—n _1 ，N — N - X - 1，并重 
复这个过程直到 n =0 o 一个类似的方法可以加快水库方法，参见 ACM Trans . 


Math . Software 11 (1985) ,37 〜 57。 

9. 水库得到 7 个记录 ：1，2,3,5,9，13，16。 最后的抽样由记录2,5，16组成。 

10. 删去步骤 R 6 和变量 m 。 用一个记录表代替 J 表，把它初始化成步骤 R 1 
中的头 n 个记录，并用新记录代替步骤 R 4 中的第 M 个表项。 
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3.4.2 小节 


11. 像在 1.2.10 小节中那样论证（那里考虑的是72 = 1的特殊情况），我们看到 
生成函数为 

^ ( x n I 1 n \ ( 2 n \ / N - n , n \ 

G ( Z ) = Z (n + 1 、 + 1 Z ) U + 2 n + 2 Z ) … （N N Z ) 

均值是 n + (nl t ) = n (1 + _ ); 方差是 n ( _ H „ ) — n 2 ( - 

H [ 2) ) 0 

12 . (注意；^ 1 =(心） ■••( hSMAJ )， 所以我们探求一个算法，它从； r 的表示进 
行到 tt — 1 的表示。）对于置 b 广 j 。 然后对于 j =2,3,…， 〆 按这个顺序）交 
換 b 广 b a 。 最后对于 j = ■…， 3,2(按这个顺序），置（这一算法是以 U〆 ） 

) J 

7^ = 7^(以）为基础的。） 

13. 重新把这副牌编号成为 0， l ，〜，2 n - 2,我们发现，5使牌号: c 成为 （2: c ) 
mod (2 ti -1) 号，同时 c 使牌: r 成为（: r 十 1) mod ( 2 / 2 - 1 )。我们有 （ c 后面是5)= 
cs 二 sc 1 。 因此任何 e 和 s 的乘积都可被变换成的形式。而且 2 ^”_ 1) 三 11 ^如- 
lo (2 rz - l ) ; 由于和 c 2 ” — 1 是恒等排列，至多可能有 （2 /z - l ) p (2 /z -1) 个排 
列 。 （不同排列的精确数是 (2/ z - l ) 々，其中々是模 （2〃-1) 下2的阶。因为如果/ 
=,则 〆 使牌0不变，所以 s k = 汐 ： 单位。）关于进一步的细节，见 SMM Review 3 
(1961)，293〜297。 

14. a ) S 。 不管他把它移动到哪里，我们都可能推导出这一点，除非他把它放到 

头三个或最后两个位置之一。 b ) 三个切和洗将产生至多八个周期地递增的子 

序列的相互混合 a x a (Xj + 1 ) mod n • •. a (工 ) +「 1 ) mod n > 因此子序列是显然的。[好多 

魔术技巧都是以下列事实为基础的，即三次切和洗是高度地非随 机的； 请参见 Mar ¬ 
tin Gardner ^Mathematical Magic Show ( Knopf ， 1997) ，第 7 章。] 

15. 对于 t _ n < j < t ，置 Yj — j 。 然后对于^ = - - n + 1 做下列运 

算：置 A — bl ；」+ l 。 如 果々〉 z _ n , 则置和 V ,。 否则如果对于某个 
z > j ，々 = x ,.( 可以使用一个符号表算法），则置 \ — Y , 和 I — y ,; 否则置 X 广 k 。 
(思路是令 n + 1 ,*-- , Yj 表不 X , _ w + 1 ，…，&，而且如果 i > j 和 _ rz ，在算法 
P 的执行过程中，也令表示 X x 。 证明 Dahl 算法的正确性是有趣的。 一 个基本 

i 

发现是在步骤 P2 中，对于 l < k < j ， X k ^ k 意味着 &>>) 

16. 我们可以假定 ， n < + N ， 否则只要找出不在抽样中的 N - n 个元素就足够 

了。使用大小为的一个散列表，想法是生成1和 N 之间的随机数，把它们存入 
表中并且放弃重复元素，直到 n 个不同的数都已生成为止。所生成的随机数的平均 
个数，根据习题3.3.2-10,是 N / JV + N /( N _ 1) + … + N /( N - n + l )<2 n ， 而且处 

理每个数的平均时间是 0(1)。 我们要以递增次序输出这些结果，而且这可以进行 
如 下：使 用具有线性探查的一个有序散列表（习题 6.4-66), 这一散列表看上去将像 
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习题答案 


是，诸值已经按递增次序插入，而且探查的平均总数将小于 I" 72。 因此如果我们对 

于键々使用单调的散列地址例如 - 1)/ N 」， 则通过对这个表作至多两遍扫描， 
以排好序的次序输出键，将是一件简单的事。[参见 CACM 29 (1986),366 〜367。] 

17. 归纳地证明，在步骤 j 之前，集合 S 是从丨1，…， j - ll 的 j - N -1+72 个整 
数的一个随机抽样 。 [CACM 30 (1987)，754〜757。 Floyd 的方法可以用来加速对 
习题16的求解。它实质上是习题15中的 Dahl 算法的对偶，该算法对 j 的递减值进 
行 运算； 参见习题12。] 

3. 5节 


1. 一个6进制序列是（参考习题 2); —个[0，1)序列否（因为诸元素仅仅取有限 
多个值）。 

2. 它是1分布和2分布的，但不是3分布的（二进数111不出现）。 

3. 重复习题 3.2.2-17 中的 序列； 且周期长度为27。 

4. 如果^(71)，以77)，4(72)，以〃）是对应于4个概率的计数，则对所有^2我 

们有 ^[( n ) + v 2 ( n ) = 1 ^ 3 ( ^ + n ) ，所以所求的结果由把极限相加得出。 


5. 


这个序列以 


22111122222222 


3 


3 


3 


3 


3 


3 


3 


3 


3 


3 


3 


3 


3 


3 


，等等开始。 


当 


(2 2k - 1 ) 



(2 


2 k 


1，3,7，15，〜时，我们有 ^72) = 1，1，5,5，〜使得 v (2 2 k ~ [ - l ) 

2 


1)/3; 因此 v ( n ) ln 在+和近于+之间 振荡； 而且无极限存在。所以概率是不 




确定的。[然而， 4.2. 4小节的方法证明，一个数值能有意义地赋予 


=PrU + 1的4进表示的最高位数字为 1) 

即 [0 g 4 2 = 士。_ 

6. 由习题5和归纳法， 

k 

Pr (对某 j ，1 < j < 々 ， Sj ( 72 ) ) = Sj ( n )) 

当时后者是以 1 为界的单调序列，所以它收敛 ; ;而且对所有々有 

k 

PriS ^ n ) 对某 J >1)> J ^ PriS ^ n )) 

对于等式的一个反例，不难通过适当的排列使彳 i 对于某个 J ， S ,( n ) 总是真的，然而 
对所有 J ， Pr ( S , U ))=0。 

7. 设 p ^ UKS ^ n ))。 上题的结果可推广到色(对某个的 SU )) 

其中诸 SjU ) 为任意不相交的命题。所以我们有 l = Pr (对某 
I 的 对某 的 S { j ( n ))^ T^ t ^ { pi = 1,因此色（对某个 j 
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3.5 节 


>1的 Sjn )) = 九。给定6>0，设/充分大，使得2/= h 设 

< h ( N ) 二 (对于某个 j > 1，使 S i ; U ) 为真的 n < N 的个数 ) /iV 
显然， E / =1 A ( iV )< l ， 而且对于所有充分大的 JV ， 我们有 S & 2 MAO > E / =2 九 

因此 ^(NXl - 丰 2 (N)- …- 令 !（NXl - p 2 - ••… Pi + - (卜 r 夕！）十 f = 

pi 十。这证明 Pr (对某 的 Sij(n ))^ p \ + 2 f ; 因此 Pr (对某 的 S 1; ( t ?)) 

= 乂，而且对于 z = l ， 所求结果成立。由假设的对称性可知，它对 z 的任何值也成 


、/ 



把定义 E 中对于 j 十 d、j 七 2 d, …， m + j — d 的概率加在 一 起。 



lim 


Xlim sup —oo 以 ” 十 lim sup^^oo^ ; 因此我们求得 


lim sup((yi n - a) 2 + … + (：y 


mn 


a 


) 2 ) ^ ma 


2ma + ma 


2 



n 


而这仅当每个 （％ - a ) 趋于 0 时才能发生。 


10. 在等式 (22) 中求和。 

11. 如果 〈 LO 是 (2,2々-1) 分布的，则是々分布的。 

12 . 以 /( Xi ，…，，… , x k )< d ]， 应用定理 B 。 


13 ‘设 

p k = Pr ( U n 开始一个长度为 6 -1 的间隔 ）= 

Pr ( -丄 G [ a ，卢），每 [ a ，/?)，…， + 卜 2 氐 [ a ，戶），+ 々 _ 丄 G [ a ，0))= 

p 2 (l - p) k ~ l 

剩下的工作是把它变换成 /(?2) - /( n - l ) = 々的概率。设以（?2)=(使得 /( J )_ 
f ( j ~ l ) = k 的的个数）；设/ ^(72) = ( 使 Uj 是 —个长度为 々 _ 1 的间隔的开始 
的 J < n 的个 数）； 且设 〆 72) 类似地统计的 l < j < n 的个数。我们有 
/^(/( w )): 1 ^ 72 ) ，"（/("))="。当 00 时，我们必定有 /( n ) — °°，因此 

v k ( n)ln = ("“/( n ))//(”））• ( f ( n ) l ^( f ( n ))) p k lp = p(l - p) k ~ X 

[我们仅仅利用了这个序列是 U + l ) 分布的这一事实。] 

14 .设 

p k = Pr ( 开始长度为々的一个运行 ） = 

P r ( L /„ — 】 > L；〆 … < U v + k ^ > U n + k ) = 


(k +2)!\ 


(々十 2) (々+ 1 




k 是 + 1 

(k + 1 ) ! (k + 2) ! 

(参考习题3.3.2-13)。现在像上题那样把它转换成？1：(/(/2)-/( 7 2-1) = 0。[我 
们仅仅假定，这个序列是 U +2) 分布的。] 

15. 对于以>0,设 

Pst = P r (X„ -2 卜 3 = 尤 —2z- 一 2z-i7^ "尤^且 
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题答案 



对于设％ 




Pr( X n - 2 t-i 


= 尤 + 5 关 X„ + 5+1 ) = 2 


一 o — s — 2i —3 


2 


- 2 卜 i 


由习题 7, 


Pr(X, 不是一个集券集合的开始 ) 


s 


>oQi 


2 



Pr(X, 是长度为 s + 2 的集券集合的开始 ) 


^t^Qp 


St 



•2 


一 s 一 1 


然后照习题 13 的办法做 


o 


16, (R.P. Stanley 的解法）每当子序列 S 


2) ，…，1，0,0 


( 心 -2) ，（ 6-1 )出现时 ，一 个集券集合必须在 S 的右边结束，因为某个集券集合在 
S 的头半完成。像在习题 15 中那样，我们现在来计算一个集券集合在位置 n 处开 
始的概率，其办法是首先考虑 S 的最近一项出现在位置 ；2 -1 ,〃 - 2 等处结束的概 
率，并在此基础上进行计算。 _ 

18. 像在定理 A 的证明中那样来计算丘和 K 。 

19. (T.Herzog 给出的解）是的。例如，当序列〈 > 满足 R4 ( 或者甚至它较弱 
的形式）时，应用习题 33 到序列 〈 R W2 」 > 上。 


20. a) 2 和（当 n 增加时，我们把 4 ⑴折半 。) 


b) 每一个新的点把单个区间分成两个部分。令 p 等于 maxg 


W - 1 


(( 72 + k ) I 





⑴< S ” 一1 7 ⑴ 




W 一 1 


pi ( 


n 



k ) 


p In 2 + 0(l/n) 0 所以无穷多 



?n 有 ml (J) >l/ln 2 + O (1/ m ) o 

c) 为验证此提示，令 / 以来自于端点为和的区间，并置 


max( m 


m 


/ - w ， i )。 于是 p 


mm 


m - n + 


! 意味着 1 


s , 2 : 


(k n } >^ 2 k ： lP K 


n 


+ a k )^2 p 


L l/( ” + 6 ); 因此 2p<ll(H 2n -H n ) 


l/ln 2 + 0(1/n) o 


d) 我们有 （ Z。 ，…， / ( / 


巧 ， ㈣ ，…，❻)，因为第以 1 个 


n 


点总是把最大的区间断开成长度为 lg I: 1 和 In 2 ^ : j 的区间 [Indagationes Math . 


11 (1949),14-17] 0 


21. a) 否！我们有 Pr[ RCf j>lmi sup„—j ( 「 2” _ 1/2 1 )/「2 


n - ]J2 


2-^2, 


W 7 ,< 食 以 2”/2” = 乃 — 1 ，因为以「 2” -1/2 1) = 以 2” = f S ;=。 

(2 々十 1/2 -2 々 ）+ 0(n) 0 

b) ， c) 参见 Mafii. 40 (1978) ， 527 〜 541 。 

22. 如果这个序 列是々 分布的，则由积分和定理 B 可知，极限为 0 。反之，注意， 
如果 /(h ， … ， a ) 有绝对收敛的傅里叶级数 




以 2 ”） 






2 


S ； 


558 


3.5 节 


/( 


工1 


, x k ) 



a{ci 


jJexpQjrKqxi + …+ c k x k )) 


< c 


■ » ♦ 


• Ci 


N 


我们有 lim N —0< n < N /( U n ，…， U n 


-1 


a 


( 0 , 


■ ♦鲁 


， o) 





，其中 





a { c 


• 、 c k 


raaxi 1 c ^ I * '** ， I I I > 


所以 


可以弄成任意小。因此这个极限等于 


a 


( 0 , 


， o) 


/I 


0 


/( 々 ，••• yX k )dx 


%参 




0 


而且等式 （8) 对于所有充分光滑的函数/成立。现在只需证明 （9) 中的函数可以通 
过光滑函数逼近到任意需要的精度。 


23. ( a ) 这直接由习题22得出。 （ b ) 以 


个类似的方式使用一 




离散傅里叶 


变换; 参见 D . E . Knuth,AMM 75 (1968) ，260〜264 


o 


24. ( a ) 令 c 是任何非零整数；由习题22,我们必须证明 


N-1 


N 



e 


ImclJ 


n 


0,当 N 


—> 


时 


n 


N-l _2 tu1cU 


这是因为如果 K 是任何正整数，我们有 
0(K 2 )o 因此，由柯西不等式 


” +七 


二 K 





、 — 1 2%icV 

^,=0 e w 


+ 


N-l 


N 


2 



e 2 W 


2 


2 x 『2 


n 


K^N 


N-l K-l 

ss 


e 27U 〜 


n 


0 k = 0 


2 + 0 (n K 


N-l K-l 


K 2 N 




e 2mcU ^k 


n 


0 A = 0 


2 + o ， K 、 


N 


1 + — 2 


N-l 


K 


K 2 N 




X ) e 2iric( ^^ 


-u 


n 


+ o 


0<,j<k< K r? 




( K \ 

IN 


1 




K 


( b ) 当 d = l 时，习题 22 告诉我们〈 0:72 + a Q ) mod 1> 是等分布的当且仅当 A 

是无理数。当 d > 1时，我们可以使用 （ a ) 和对 d 的归纳法 。 [Acta Math . 56 
(1931),373 〜456。 （ b ) 中的结果以前已经由 H . Weyl 以更复杂的形式得到， Nac/ir 
Gesellschaft der Wiss . Gottingen , Math . - Phys . Kl . (1914) ， 234 〜 244。 一 个类似的论 

证证明多项式序列是等分布的，如果系数〜，•••，“至少有一个是无理数。] 


25. 如果这个序列是等分布的，则推论 S 中的分母趋于_，而分子趋于这个习 


题中的量。 

26. 见 Math , Comp . 17 (1963) ，50〜54。[也考虑 A . G . Waterman 给出的下列例 

子:设 是一个等分布的[0，1)序列，是一个⑺分布的二进序列。根据尤 
为0或1设 L / r ^ n 或1 - L / r / m ， 则 〈 VJ 是等分布和白的，但 Pr ( K = % + 1 )二 

设 = ( y 7i -,J mo d 1，其中 〈〜> 是单调地减小成 0 的任何序列；则 〈D 是 
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等分布和白的，而 Pr ( W n < W ri + l ) = ~ 


28. 设 〈 R > 是 00 分布的，并考虑序列〈|(&十利用是（16,3)分布 
的这个事实可知，这是3分布的。 

29-如果是任意二进数，则我们可以考虑 Xy “ X x = x 的次 
数 4 U )， 其中而且0为偶数。类似地，设 €(72) 计算当 f 为奇数时的次 

数。令 ( 72 ) + ^ ( 72 ) = ^ ( 72 ) 0现在 





并* •■并 


71 ) ^ 



O 

^ *0 


n ) ^ 




** 0--* 


n ) ^ 





v 




n 


在这些和式当中的诸 v 有个下标，下标当中有 -1 个是星号（表示它们在被求 

和-每个和是对0和1的所有 2 M - 1 个组合进行），而且其中“〜”表示近似等式 

(除了由于结束条件的至多为的误差外），因此我们求得 



2kvl(n) 


V * 0 长 


► ♦ 4 -¥r 



71 




_»# 


h … o( n)) • 



— 2 (r(x) - s(x))v^(n) + o(—\ 

n u 工 x \ n j 

其中 JC = jcr •■: r 2/fe 在奇位置中包含 r (: r ) 个0,并在偶位置中包含 s ( x ) 个0。由（2々 ) 
分布可知，带圆括号的量趋于 k(2 2k - l )l2 lk = kl2 。 当 rU )> H ：0 时，如果 vf ( n ) 
=匕（72)，以及当 r (: c )< s (: c ) 时，如果 vf (7 Z ) =0,剩下的和显然是一个极大值，所 
以右边的极大值为 


现在 


k 

2 


十 S ( 

0^ s < r^k 


r — 


s) 


( k \( k \ 

\ r ) \ s I 




= 0 )<iim sup „—4(2 tz )/ tz ， 所以证明完成。注意 



= 2n2 2n ~ 2 + 72 ( 2n ~ ^ 

r / \ s / \ n / 



30. 构造标号为 （ Ex 〗 …: r 2 ( — J 和 （ …: t 2 h ) 的 2 2 * 个节点的一个有向图，其 

中每个勺为0或1。设从 （仏 1 ".工 2 卜 1 )到（0^ 2 ."工 2 々）有1十/(工 1 ，工 2 ，...，：^)条 

有向边，而从 （ Ov x 2 H ) 到（£工2…〜）有1 - /( A , x 2 ，…，: r 2 A ) 条有向边，其中 

/( 工 1 ，工 2 ，…，工 2 々 ） = sign ( jc 1 - + x 3 _工 4 十…_仏 ） 。我们发现每个节点有相同 

条数的有向边从它引出和引 向它； 例如，…:有1 -/(0，：^，…，: C 2 H ) + 1 

，…，: c 2 々—0条有向边引向它，以及有 1 + /( h ，…， ， o ) 十 1 +/(:^， 

…? x 2 k - 1，1)条由它引出，且 f ( 工， 工1 ， … , X 2 k - 1 ) = ~ f ( ^ I ， •••2々- 1，工 ) o 去掉没 

有引向它或由它引出的通路的所有节点，即如果 f (0, x 1 r -, x 2k . l ) = +1则删去 
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1) ，如果 /( I ，工1，…，工2卜 l ) = - 1贝丨」删去 （ Ovx 2 卜山得到的有向 

图可看出是连通的，因为从任何节点我们可以达到 （£1010 … 1) 和从这一节点我们 
可以到达任何要求的节点。由定理 2.3.4.2 G ， 有遍历每一条有向边的一个循环通 
路; 这个通路有长度2 2 * + 1 ，而且我们可以假定它在节点 （£00 … 0) 开始。构造具有 
Xl = … = 的一个循环序列，而且如果这个通路的第 n 条有向边是从 

…工2卜1)到 （ 0工2…工 M ) ，或者从 （ 0工1 …工2卜1 ) 到 （ E 工 2 … ) 的，则 X n +2 k ~\ = 

x 2 , 0 例如，对于 A =2的图如图 A -5 所示，循环通路的有向边从1编号到32,循环序 


列是 


( 00001000110010101001101110111110 )( 00001 •■•) 



图 A 〜5 习题30中构造的有向图 

注意在这个序列中 Pr ( x 2 „ =0) = 3。这个序列显然是（2幻分布的，因为在这个循 
环中每 （2/0 兀组：岀现 

1 + /(Xi ，…，工2々）+ 1 - /(工1，…，工2夫 ） = 2 

次。 Pr ( X 2 „ = 0) 有所求的值这一事实来自于在上题的证明中右边的极大值已由这 
个构造所实现。 

31. 使用算法 W 并使用规则选择整个序列。[关于在 R 5 序列这种类型的 

非随机行为的一个推广，参见 Jean - Ville , Etuc/e Critique de la Notion de Collectif 
( Paris :1939)，55 〜 62。也许从这个观点看， R 6 也太弱，但是现在还不知道这样的反 

例。] 

32. 如果 A ， W 是可计算子序列规则，则 狀 由下列函数定义: 
f n (: Co ，…，:^― J = 1当且仅当 W 定义工0,…，: j 的子序列： c r ，…， x r ，其中々>0 

和 (X r T < …< q < rz 和 /\( ，…，) = 1。 

1 k 

现在是（〈:由此立即得到结果。 
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33. 给定 e>0, 求 iV 0 使得 /V>/V 0 意味着 I v r ( N)/N _ p I 〈（和 I v 5 (iV)/iV - /? < 
^两者都成立。然后求使得 N > iV: ，意味着对于某个 M > N 0 , t N 是 r M 或 s M c： 
现在 N > N ： 意味着 


^(N) ^ 


v r ( N r ) + v s ( N s ) 


v r ( N r ) 

pN r +、（ N S ) — pN s 

N _ p 


N p 


N r + N s 


< 



34. 例如，如果 z 的二进表示是 （1 0 6 — 2 1 0M 1 0' 1 0〜） 2 ,其中 “(T” 代表 a 


个连续的0的序列，令规则接受 R 当且仅当 


(X \ 


，- n — 1 


° 


35. 令 a 0 = 


so 


和 


a 


m 


~ maxi s k I 0^ k 〈2 


a 


m 


构造一个这样的子序列规则，即 


当 n 是在‘ i 的范围内时，这个规则选择I当且仅当对于某个々<2〜， 


W n = s k 。^ ^ lim m ^oo v ( a m )l a m — 0 

36.设6和6是任意的大于1的固定整数。设 Y v = lbU n ] o 由算法』和^?确 
定的任意无穷子序列〈；> =〈八(像在定理 M 的证明中那样）以直接的但从记 

W 

号上看来不足取的方式对应于算法^它们检查〈乂」的足，足 + 1 ，…，足 + 5 和 
(或）选择足， \ + 1 ，…，当且仅当 A 和^检查和（或）选择I，其中 R 
= (0.X, 足 + r ..X, + J 2 。 算法 Y 和确定的一个无穷1分布子序列，而且事 

实上（如在习题32中那样），这个子序列是⑺分布的，所以它是 U，l) 分布的。因此 
我们发现 = 和丙 (Z„ = a) 同 1M 相距小于1/2、 

[如果 “ R6” 一直用 “R4” 或 “R5” 代替，则这个习题的结果 为真; 但如果使用 “R1” 

则它为假，因为可能恒等于0。] 


37. 对于用 |( LV +\) 代替 LV, 其中根据集合 I ^ 2 -! 


包含偶数个或奇数个小于^■的元素而令\ = 0或1。 [Advances in Math. 14 

(1974) ,333 〜 334;也见 Thomas N. Herzog 博士论文 , Univ. of Maryland(1975) 0 . 

39. JilActa Arithmetica 21 (1972) ,45 〜 50。 c 的最好值未知。 

40. 由于 M 又依赖于仏…私，我们有 P(Af，$ N ) = ^ 。设 q(B l -B k ) = Pr 

(艮 + 1 = l|B r .. 私），其中概率是对于有仏…氏作为头 A 个二进位的 S 的所有元素 
来取的。类似地，令％(召1".凡）= Pr(F 々 =1且 B、 + 1 =办也…私）。于是我们有 
?r(A p k = 1 | 圪 … 私） = Pr((Fi + 巩 + 1 + B ；； + 1 ) mod 2 = 1 | & … 私 ） = g • 

(士 _9 0 + 91) + (1_9)-(90十|_91) = 士_“0 + 91)十 2 (收1 + (1_仏0) = 士 

- Pr(F/, = 1 | B x ''' B k ) + 2Pr(P\ = 1 和冗 + 广私 + 丄丨仏…仏）。因此 Pr(Af = 1) = 
S B -B Pr (_B 1 ."_B /j )Pr(Af = l|B 1 ."B / J = }-Pr(h = l) + Pr(R + 1 = l )。 [参见 

1 k A 
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Goldreitch , Goldwasser 以及 Micali 在 /ACM 33 (1986)，792 〜 807 中的定理 4。] 

41. 从10,…， TV-1 丨一致地选择 A 并且使用引理 P1 中的证明。于是 P1 的证 

明表明 ，A X 将以 - 九十九 + 1 )/W 的概率等于1。 

\乙 / 

42. a) 设 X=Xi + …+ X„。 显然 E(X) 二 n"; 而且 我们有 E (( X - ? iju ) 2 ) = 

EX 2 - nV 2 = ^EXj + 2S 1<i < ;<;J (EX,)(EX y ) - n 2 = nEXj — np 2 二 na 1 0 而且 
E((X _ nfi ) 2 ) = J：Pr (( X - n^x ) 2 = x ) ^ ^ x ^ tna 2 : rPr (( X _ n" ) 2 = x ) ^ 

^ x > tna 2 ^^ 2 Pr( {X ~ nfj .) 1 — x ) — tn ( j 2 Pr ( (X ~ njj . ) 2 ^ tna 2 ) 0 

b) 有一个位置 i， 其中 d = i。 然后有另外一个位置 
j ，其中 c 3 = 1 0 对于在不同于 z 或 j 的々 - 2 行中 B 的任何固定设置，我们有 （cB ， 
A) = u，^r) 当且仅当行 2 /有特殊 的值; 这以 i/2 2i? 的概率出现。 

C) 在算法 L 的记号下，取72 =2& -1 和 又 = (-lpw + d ; 于是 " = S 和^ = 

l _ s 2 o X = S # 0 X c 为负的概率至多是 （ X - ¥) 2 > n 2 〆 的概率。由 a ) 这至多为 

(y 2 l ( nfuL 2 ) o 

43. 对于固定的 M 的结论将是没有意义的，因为明显地存在一个算法（即，知 
道因子的一个算法）来对任何固定的 M 进行因子分解。这一理论适用于有短的运 
行时间的所有算法，而不仅是有效地可发现的那些算法。 

44. 如果对于一个随机表的每一个位的变化产生一个随机表，则所有表是随机 
的（或者全都不是），如果我们不允许随机性的度，则因此回答必须是“不总是”。 


3 _ 6节 


1. 


RANDI 


9H 

XRAND 

8H 

7H 


STJ 

STA 

LDA 

MUL 

INCX 

J0V 

SLAX 

STA 

MUL 

INCA 

JMP 

CON 

CON 

CON 


9F 

8F 

XRAND 

7F 

1009 
*+ 

5 

XRAND 

8F 

1 




1 

0 


3141592621 


存出口位置 

存 k 的值 

rA— X 
r AX — 


rX — (aX + c ) mod m 

确保溢出开关断开 

r ( aX + c)mod m 

存 x 

rA—UX/m 」 

加1，使得 

返回 

X 的值； X Q = 

k 的临时存储 
乘数 a 


2. 把一个随机数生成程序放到一个程序中使得程序的结果实际上不能为程序 
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员所预测。如果预先知道每个问题在机器上的运行特性，则很少会有人去写程序。 
然而如图灵曾经说过的，一台计算机的动作确实经常使程序员感到惊奇，特别是当 
他正在对他的程序进行调试时。 

所以人们最好要注意。 

7. 事实上，你只须2个二进位的值 LX „/2 16 」mod 4;参见 D . E . Knuth , IEEE 

Trans . IT -31 (1985)，49〜52 。 ]. Reeds .Cryptologia 1 (1977) ,20-26 ；3 (1979),83 - 

95,发起了相关问题的研究。也见 L . BIum , M . Blum 以及 M . Shub , S/COMP 15 
(1986) ， 364 〜 383; J . Boyar ， J . Cryptology 1 ( 1989 )，177 〜 184。在 S/COMP 17 
(1988) ， 262 〜 280 ^ , Frieze , Hastad , Kannan , Lagarias Shamir 讨论 了在像这样的 

问题中有用的一般技术。 

8. 我们可以，比如说，通过做一百万次连续的调用生成 X 1Q(K) _ ，并把它同正确 
值 （ a 1000000 X 0 + ( a 1 000000 - l ) c /( a - l))modm 作比较，它也可以表达为 （ U 1 000000 - 

( X 0 (a - l ) + c )- c ) mod (a ~ l ) m)/(a - 1)。 后者可以通过一个独立的方法快速 

地进行计算（参见算法4 . 6 _ 3 A ) 。例如，48271 1000000 mod 2147483647 = 1263606197。 
大多数错误都将可以探测出来，因为递推 （1) 不是自校正的。 

9. a ) ，…， X 99 的值不全为偶数，多项式+ ^ 37 + 1是本原的（参见 

3.2.2 小 节）； 因此有一个数 A ⑴使得 P 0 ( z ) 三 z A (5) ( 模2和 z 100 + z 37 + l ) o 现在 

zP n + 1 ( z ) = P n ( z ) ~ X n z 37 ~ X n + 63 + X n +63 z m X v + m z 37 ^ P n ( z ) + X n + 63 ( z 100 

+ z 31 + 1) (modulo 2) ，所以由归纳法结果成立。 

b ) 在 mn — start 中的运算“平方”和“乘以把 p ( z ) = …+ x x z ^ xq 

分别变成 p ( z ) 2 和冲（ z ) ，模2和 2 ： 100 + z 31 + 1，因为 p(z ) 2 = p ( z 2 ) o (我们在这 
里仅考虑低阶二进位。其它二进位以趋向于保持和/或增强它们已有的无论什么样 
的无序的一种特殊方式来加以操作。）因此，如果 S = ( ly 5 l 5 Q ) 2 ，我们有 h ( s ) = 

c ) 之 A ⑴1三模2和 z 1 。。 + z 37 + 1) 意味着 h ( s ) - n ^ his ') - 

2_-1)。由于2 69 </1(5)<2 1 。。- 2 69 ，我们有丨72-72 / |>|/1(0-/1(，）|>2 70 。 

[这个初始化的方法是由 R . P . Brent 的评述启发而成的，见 Proc . Australian Su ¬ 
percomputer Conf . 5 (1972)，95 〜 104, 尽管 Brent 的算法完全不同。一'般地说，如果 

这些延搁是，如果 0< s <2 e ， 和如果分开的参数 i 满足 i + 则这个证明的 

方法表明 I n _ 〆 I ^2 L _ 1，而且仅当丨5,5 / 丨=|0,2 6- 1丨时2£-1才出现。] 

10. 除了使用 PARAMETER 语句以增加可读性外，下列程序属于美国国家标准局 
定义的简化的语言子集 FORTRAN 。 

SUBROUTINE RNARRY (M ， N ) 

IMPLICIT INTEGER(A- Z) 

DIMENSION AA( * ) 

PARAMETER (KK = 100) 
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PARAMETER (LL= 37) 

PARAMETER (MM= 2 ** 30) 

COMMON /RSTATE/RANX(KK) 

SAVE /RSTATE/ 

DO 1 J = 1,KK 

1 AA(J) = RANX(J) 

DO 2 J = KK + 1, N 

AA(J) = AA(J - KK) - AA(J - LL) 

IF (AA(J) . LT. 0) AA(J) = AA(j) + MM 

2 CONTINUE 

DO 3 J = 1, LL 

RANX(J) = AA(N + J - KK) - AA(N + J - LL) 

IF (RANX(J) .LT. 0) RANX(J) = RANX(j) + MM 

3 CONTINUE 

DO 4 J = LL 十 1,KK 

RANX(J) = AA(N + J - KK) - RANX(j - LL) 

IF (RMX(J) . LT. 0) RANX(J) = RANX(j) + MM 

4 CONTINUE 

END 

SUBROUTINE RNSTRT(SEED) 

IMPLICIT INTEGER (A- Z) 

PARAMETER (KK= 100) 

PARAMETER (LL= 37) 

PARAMETER (MM = 2 ** 30) 

PARAMETER (TT = 70) 

PARAMETER (KKK = KK + KK - 1) 

DIMENSION X(KKK) 

COMMON/RSTATE/RANX(KK) 

SAVE /RSTATE/ 

IF (SEED . LT. 0) THEN 

SSEED = MM - 1 - MOD( - 1 - SEED,MM) 

ELSE 

SSEED=MOD(SEED,MM) 

END IF 

SS = SSEED - MOD(SSEED,2) + 2 
DO 1 J = 1,KK 
一 X(J)=SS 
SS = SS + SS 
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IF (SS .GE. MM) SS = SS - MM + 2 

1 CONTINUE 

X(2) = X(2) + 1 
SS = SSEED 
T = TT - 1 

10 DO 12 J = KK,2, - 1 

X(J + J - 1) = X(J) 

12 X(J + J - 2) = 0 

DO 14 J = KKK, KK + 1,-1 

X(J- (KK-LL)) =X(J_ (KK-LL)) _X(J) 

IF (X(J- (KK-LL)). LT.O) X(J - (KK - LL)) = X( J - (KK - LL)) + MM 
X(J - KK) = X(J - KK) - X(J) 

IF (X(J - KK) .LT. 0) X( J _ KK) = X(j - KK) + MM 

14 CONTINUE 

IF (MOD(SS,2) . EQ. 1) THEN 
DO 16 J = KK ， 1, _ 1 
16 X(J + 1) = X(J) 

X(l) = X(KK+ 1) 

X(LL+ 1) =X(LL+ 1) -X(KK+ 1) 

.IF (X(LL + 1) . LT. 0) X(LL+ 1) = X(LL+ 1) + MM 

END IF 

IF(SS. NE.0)THIN 
IF(SS.NE.0)THEN 
SS = SS/2 
ELSE 

T = T - 1 
END IF 

IF (T . GT. 0) GO TO 10 
DO 20 J = 1，LL 

20 RANX(J + KK - LL) = X(j) 

DO 22 J = 1,10 

22 CALL RNARRY( X, KKK) 

END 

11. 符合 ANSI / IEEE 标准 754 的对 64 个二进位操作数的浮点算术允许我们以 
对分数 R 的完满精度来计算 U n = ( U n - 100 ~ _ 37 ) mod 1，这些 R 是 2 — 53 的整 

数倍。然而，下列程序使用的却是对厂 53 的整数倍的加法递推 U n = ( U n - l00 ^ 

U n - 31 ) mod 1，因为与对一个中间结果的符号作条件转移相比，流水线计算机可以 
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更快地进行减一个整数部分的运算。习题9的理论同样很好地适用于这个序列。 
在 Wad 中主要的新思想是保持在 w 的分数的低有效位中的内的一个副 

本。类似于习题10的程序的一个 FORTRAN 翻译将和这个 C 程序一样生成完全 
相同的数。 

# define KK 100 / * the long lag * / 

# define LL 37 / * the short lag * / 

# define mod — sum(x，y) (((x) + (y)) - ( int) ((x) + (y))) 

/ * (x + y) mod 1.0 * / 

double ran. u[KK] ； / * the generator state * / 

void ranf _ array (double aa[ ] , int n) j / ^ aa gets n random fractions * / 
register int i，j ; 

for (j = 0; j < KK; j ++ ) aa[ j ] = ran _ u[ j ]; 

for (； j <n； j ++ ) aa[ j ] = mod— sum(aa[ j - KK]，aa[ j - LL])； 

for (i =0; i<LL； i ++ ， j ++ ) ran«u[i] = mod. sum(aa[ j - KK]，aa[ j - LL])； 

r 

for ( ； i<KK； i ++ ， j ++ ) ran_ u[i] = mod_ sum(aa[ j - KK] ， ran — u[ i - LL]); 

^ define TT 70 / * guaranteed separation between streams * / 

#define is_odd(s) ((s)&l) 

void ranf ^ start(long seed) 丨 / 关 do this before using ranf _ array * / 

register int t，s，j; 
double u[KK + KK - l]； 

double ulp= (1.0/(lL«30))/(lL«22 )； / * 2 to the - 52 * / 

double ss = 2.0 * ulp ^ ((seed&0x3fffffff) + 2)； 
for (j = 0;j<KK；j ++ ) j 

x[ j ] = 0 ； u[ j ] = ss ； / * bootstrap the buffer * / 

ss += ss; if (ss>= 1.0) ss- = 1.0-2* ulp； 

/ * cyclic shift of 51 bits * / 

i 

x[ 1 ] = 1 ； u[ 1 ] + = ulp; / * make u[ 1 ] (and only u[ 1 ] )"odcT / * / 

for (s = seed&0x3fffffff,t = TT - 1 ； t；) j 
for (j =KK-l;j>0;j-~ ) 
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\ 


x[j + j] = x[j] ， u[j + j] = u[j] ， x[j + j- l]=0 ， u[j + j-1] = CL0; 

/ * "square" * / 

for (j =KK + KK-2;j>=KK;j -- ) | 

x[ j - (KK- LL)] = x[ j]-x[ j - (KK-LL)], 

u[ j - (KK - LL) ] = mod— sum(u[ j 一 (KK - LL) ] ,u[ j ]); 

x[ j - KK] = x[ j]^x[ j _ KK] ， u[ j _ KK] = mod. sum(u[ j - KK] ， u[ j]); 

if (is_odd(s)) i / * "multiply by z" * / 

for ( j = KK; j >0; j -- ) x[ j] = x[ j - l] ,u[ j] = u[ j - l]; 

x[0] = x[KK] ,u[0] = u[KK] ； / * shift the buffer cyclically * / 

x[LL] = x[KK]^x[LL] ,u[LL] = mod_ sum(u[LL] ， u[KK]); 

: 

if (s) s»= 1; else t ; 

for (j = 0;j<LL；j + + ) ran — u[ j + KK - LL] = u[ j ]; 

for ( ； j<KK ； j ++ ) ran_u[ j _ LL] = u[ j]; 

for (j =0;j<10;j + + ) ranf — array (u ， KK + KK - 1); 

/ * warm everything up * / 


int main() | 

register int m；double a[2009 ] ； / * a rudimentary test * / 

ranf — start(310952); 

for (m = 0 ； m<2009；m ++ ) ranf _ array (a, 1009); 

printf(" % .20f \ n" ， ran_u[0]); / * 0.36410514377569680455 */ 

ranf _ start(310952); 

for (m = 0 ; m<C 1009 ； m + + ) ranf _ array(a ， 2009); 

printf % .20f \ n ,ran_ u[ 0 ]) ; /* 0.36410514377569680455 * / 

return 0 ； 

I 

12. 像 （1) 这样的一个简单的线性同余生成程序将失灵，因为 w 将太小了。通 
过组合三个（而不是两个）这样的生成程序，而且如同 P . L ’ Ecuyer 在 CACM 31 
(1988 )，747〜748上建议的，使用乘数和模 （ 157，32363 ) ， （ 146，31727 ), (142, 
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31657)，有可能得到好的结果。然而，最好的方法大概是使用 C 程序 ran. 


array 


ran - start ，连同下列的改动以保持所有的数都在范 围中： “long” 变成“ int” ； “MM” 被 


定义为 “（1 U < < I 5 )” ；而且变量的类型应是 unsigned int (无符号整数）。这生成 
15个二进位的整数，它的所有二进位都是可用的。种子现在被限制在[0,32765]的 
范围中。这个“基本检验程序”在给定的种子12509之下，将打印 X 100 9 x 2009 = 24130 
(注意 main () 程序中的每个％ Id 应改为％ d ) 。 

13. 用于带借位减法的一个程序将很类似于但稍慢些，因为要进 

行进位的维护。如同在习题11中那样，浮点算术可以以完满精度被使用。通过以 
序列的第（ - 77) 个元素来初始化生成程序，有可能来保证由不同的种子 s 所产生的 
序列的不相交性，其中72 =2 7 〜； 这要求计算 b n mod ( b k - V ± 1)。然而，把一 个办进 
制的数模夕±1取平方要比在程序 ran _ start 中类似的运算复杂得多，而且对 

于在实用范围中的々，它大约要花费个运算而不是 OU )。 

当两个方法有大约相同的々值时，在应用中它们大概生成相同质量的序列。两 
者之间惟一重要的差别是一个更好的理论保证和对于带借位减法的一个可证明的 
巨大 周期； 对于延搁斐波那契生成程序的分析是不大完备的。经验表明，我们不应 
仅仅由于这些理论的优点而减少在带借位减法中々的值。当所有这些都已经说了 
和做了之后，从一个实用的观点看，延搁的斐波那契生成程序似乎是可 取的； 而带借 
位减法有价值主要是由于它为我们提供的对较简单方法的卓越特性的启示。 

14. 我们有 X n + 200 三十 Xn + wKmodulo 2) ;参见习题3.2.2-32。因此当 n 


mod 100〉73时，十 26 。类似地 + 200 = + 26 + 尤 + 的；因此 

当” mod 100 < 11 时 y w + 100 三 l 十 y „ +26 + y„ +89o 因此 Y „ + 100 在所有情况的 

26% + 11%中，是丨7„，〜，匕 +99 1中的仅两个或三个之和；0的数量优势将趋于使 


+ 100 =0。 

更精确地说，考虑序列〈⑷，，…> =〈126, 89, 152, 115,78,…，100, 63, 
126 ，…〉 ，其中 + 1 -37 + 100[〜<100]。然后我们有 


X”+2oo = + X n + V + *•* + X n + V + X u ) mod 2 

1 k-2 k-\ 

其中 Vj= Uj + ( - l)h >1()0] 100 ; 例如，又 + ■三尤 + X„ + 26 + X„ + 189 + 又 + 152 = 又 + 

+ 26 + 189 + + 5 2 + + 115 。 如果下标全都小于72 + Z 和大于等于72十100 + Z ， 

对于1<〖<100,当 72 mod 100 = 100- Z 时，我们得到对于 1 + _ 的一个々项表达式。 
，= 63的情况是一个例外，因为尤+尤 + 1 +…+ X „ + 62 + X , + 163 + 尤 + 164 十…+ 
尤 + 19 戸 0;在这种情况下 Y „ + _ 与丨 Y〆 "， \ + 99 1无关。，=64的情况是有趣的，因 
为它给出99项关系 Y n + \ 00 =yn + l + 1+2 +…+ k + 的； 尽管有这么多的项但这趋向 

于为0,因为有40或更少的1的100元组的大多数都已经有偶的奇偶性。 

当有 一个々 项关系时， Y„ + 1()() = l 的概率是 
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当诸二进位被打印时，量〖取值 100,99,… ， 1 ， 100,99,… ， 1 ， …； 所以我们求得预期 
被打印的 1 的个数为 10 6 (26/) 2 + llp 3 + 26 p 4 + llp 6 + llp 9 + Ap n + 4/) 20 + 3/) 28 + 

/>47 + ^74 + P99 + 1/2 )/100 ^ 14043 0 预期打印的十进数字的个数是 

A 100 ^ 28444 ，所以预期的 0 个数 〜14401 0 

^ _ ^ V I / / 

如果拋弃掉更多的元素则可检测的偏倚就可以去掉了。例如，如果仅使用 
ran - array ( a , 300 ) 的 100 个元素，可以证明概率是 (26 p 5 + 22p 6 + 19/) 10 + *** )1 

100 ;对于 mn _ array (a ， 400) 它是很糟糕的 ( 15p 3 + 37 p 6 + 15p g + )/100 ,因为 

+400=^n + X, + 252 o 如同在正文中推荐的那样，对于 1009 )，我们 

有 (17 夕 7 + 10^n 十 2/> 12 +… ） /100 ，如果打印的阈值从 60 提高到比如说 75 ，则它仅可 

由这样的实验加以探测。但那样一来，预期的输出数字仅大约为每百万个试验中的 
0.28 个。 

[ 本习题是基于 Y. Kurita , H. Leeb 和 M. Matsumoto 于 1997 年同作者通信时的 
思想给出的 。] 

15. 下列程序使得可能很快地通过表达式 ran _ arr _ () 得到 一 个新的随机 

整数，一旦已经调用 mn-Wad 来使事情 开始： 

井 define QUALITY 1009/ * recommended quality level for high-res use * / 
long ran _ arr _ buf [ QUALITY ]; 

long ran_ arr — sentinel = - 1 ； 

long * ran_ arr _ ptr = &ran„ arr _ sentinel; 

/ * the next random number ， or - 1 * / 

# def ine ran_ arr — next() ( * ran 一 arr _ ptr) = 0? 

* ran — arr _ ptr + + : ran„ arr — cycle()) 
long ran_ arr _ cycle() 

( 

ran _ array(ran _ arr _ buf ， QUALITY); 
ran_ arr _ buf [ 100 ] = - 1; 

ran — arr _ ptr = ran_ arr_ buf + 1; 
return ran _ arr _ buf [ 0 ]; 

i 

若须再次调用 r ㈣ _ arr - ，则重置 ran - arr - ptr - &ran - arr _ sentinel 0 

4.1 节 


1. (1010)— 2 , （1011)— 2 ，（1000)— 2 ，…， （11000)— 2 , （11001) _ 2 , （11110) _ 2o 
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2. (a) - (110001)2, —（11. 001001001001 … ） 2 ，（11.00100100001imi0110101 …） 2 。 

(b) (11010011)_ 2 , （ 1101. 001011001011… ） - 2 , （ 111.0110010001000000101... ) 一 2 。 

( c ) ( Tin ) 3 ,( To . onoiiouoii ，.） 3 ，（ io . oiiIiiiToooToiiTiioniiiiiio —) 3 。 

( d ) — (9.4) 1/10 , - (••■7582417582413) 1/10 ,(***3462648323979853562951413) 1/10o 

3. (1010113.2) 2l 。 

4. ( a ) 在 rA 和 rX 之间。 （ b ) rX 中的余数的小数点在字节3和4 之间； rA 中 
的商的小数点在寄存器最小有效位部分右边一个字节处。 

5. 它已经从 999."9 = 10 p - 1减去，而不是从1000…0 = 10々减去。 

6. ( a ， c ) 2户- 1 -1， - (2^' - l )；( b )2 /> ' 1 -1, -2”、 

7 - — 个负数 : r 的10的补码表示，可以通过考虑 1 (T + : r (其中72要足够大以使 
这个数成为正的）并以无限多个9对它向左边扩充。9的补码表示可以通常的方式 
得到（对于无尽的十进数这两个表示是相等的，否则9的补码表示有… （ a )99999 … 
的形式，而10的补码表示有 … （a + 1)0000 …的形式）。如果我们把无限和 N = 9 + 
90 + 900 + 9000+…的值当做-1，则这些表示可以认为是明智的，因为 N -10 N = 

9 0 

还可看习题31,那里考虑了 p - adic 的数系。对于 p 进制表示为有穷的数，它 

同这里考虑的 p 的补码记号一致，但在 p - adic 数域和实数域之间没有简单的关 
系。 

8 . 2 户 〆 = 卜 k — 'b k - 1 + …+ a kj )b h 。 

9* A BAD ADOBE FACADE FADED 。 [注 ：其它 可能的“数的 句子” 将是 DO A DEED A 

DECADE;A CAD FED A BABE BEEF,COCOA,COFFEE;BOB FACED A DEAD DODO。] 


则 

■ 


a k. + j - 1 » 

10. 如果 ' 



…， "a 一 2 ,… 


…, A 3 , A 2 , Ai , Aq ； A -!, A - 2, … 

-… ， b 3 ， b 2 ， bi ， b Q \b — x 、b 一 2，… 」 


, B 3 , J3 2 , , B 0 ; J3 - !, B _ 2 > 


其中是任意的无限整数序列，且々 ;+1 >卜。 

11. (依赖于选择的是正号还是负号，下列算法对于加法或减法有效。） 

以置 k ^ a n + l ^ a n + 2 ^ b n + l ^ b n + 2 ^ 0 开始；然后对于 m = 0，1广‘，?2+2进行 

如下操作：置 c m — a m ± b m + 々；然后如果则置 A — - 1且 Cm — Cm - 2;否则如 

果<0，则置々—1且 c m — c m + 2;否则（即如果，贝置0。 

■ 

12. ( a ) 在负二进系统中从± (… a 4 Oa 2 Oa 0 )_ 2 减去士 （…( —个更巧 
妙的解见习题 7.1-18, 该解使用全字位运算）。 （ b ) 在二进系统中从（…6 4 06 2 0心) 2 
减去（… 630 ^ 0 ) 2 。 


13. (1. 909090…）_ 10 = (0. 090909…)^ 
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16. 试图以非常简单的方式来完成是有吸引力的，例如，用规则 2 = ( 1100 ), 
进位； 但是如果（比如说）我们试图把 1 加到 （ 11101 );^ = - 1 的话，这导致一个无尽 
的方法。 

下列的解通过提供四种有关的算法（即加减 1 或 0 做这件事。如果 a 是 0 和 1 
的串，令 a p 是 0 和 1 的串，使得 ul-f + 1 ;并令 a — :/^^类似地定 

义，且用 - i ，+ i 和 - i 分别代替+ 1 ，则 

( a0) p = al ; ( axl) P = a Q xO 
( aO) Q = a P l ; ( al) Q = a ~ Q 0 

( axO ) P = a ~^ xl ; ( al )~ P — aO 
( aO) _Q = a Q l ; ( al)~ Q = a ~ P 0 

这里： r 代表 0 或 1 ，如果需要的话，在这些串的左边扩充0。这个过程显然会终止 
的。因此形如 a + M 的每个数，当 a 和 6 为整数时在 i _ 1 系统中是可表示的。 

17. 否（不管习题28如 何）； 数 -1 不能这样表示。通过像在图1中那样构造集 
合 S 可以证明这一点。我们确实有表示 - i =( 0 . 1111 …） 1 + i ， i =( 100 . 1111 …） 1 + 1 。 

18. 设 S Q 是点（< 2 7 < 2 6 a 5 <23 q 的集合，其中每个 W 是 0 或 1 ( 如果 

该图放大16倍，则 So 由图1所示的256个内点给出）。我们首先证明 S 是封 闭的： 

如果…是 S 的一个无限子集，则我们有％ = 2心0^16_\其中每个 〜在 

So 中。构造一棵树，其节点是 （心 ,，…， a ^ hKrgrz ， 而且设这个树的一个节点是 

另一个节点的祖先，如果它是后一节点的一个初始子序列的话。根据无限性引理 
(定理2 .3.4 K ) ，这棵树有一无限通路 （ q ， a 2 ， a 3 ，…），由此知〜 16 — a 是 S 中 

I ： yi ，: v2 , … 1 的一个极限点。 

由习题16的答案可知，形如 （a + bi ) i \6 k 的所有数，当 a 和6为整数时，都是可 
表示的。因此如果： r 和 y 是任意实数且6 >1，则对于某整数 m 和 72 ,数 q = 
( L 16~」+ Ll 6\」 i )/16 々在 S + m + 中。可以证明，当 （ m ， n ) 参 （0,0) 时 ， S + m + 
ni 到原点的距离有界。因此，如果 1 x 1 和 Id 固定且々充分大，我们有 qGS ， 而且 
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lim^—co = 工 + 在 s 中。 

[B. Mandelbrot 称 S 为 “ 双龙 ” ，因为他注意到它实质上是由两条 “ 龙曲线”腹对 
腹地连在一起得到的；见他的著作 Fracfa/s: Form ， Chance，and Dimension (San Fran¬ 
cisco : Freeman, 1977),313- 314 0 在该书中他还指出界的维数为 21gx ^ 1 . 523627 , 
其中 ： r = 1 + 2, 2 〜 1.69562 。龙曲线的其它性质在 C. Davis 和 D.E.Knuth 的文章 
中有介绍，见 J, 尺 ecr. Math. 3 ( 1970) ， 66 〜 81 ， 133 〜 149 。 D. Goffinet 在 AMM 98 

(1991),249 〜 255 中对数字 i0 ， 11 和其它复基的集合 S 作了说明和分析 。] 

I . KAtai 和 J. Szab6 已经证明 _ d + i 进制产生具有数字丨 0 ， 1,… ， d 2 丨的一个数 
系； 请见 Acta. Sdem. Math, 37( 1975) ,255 -260 0 W.J. Gilbert 考察了这样的系统进 

一 步的性质 y Canadian ] . Math. 34(1982) , 1335 〜 1348 ;Math. Magazine 57 (1984) ,77 

〜 81 。 ▽ 小 0 從 )11 提出了对于数字 |0 ， 1 ， 1, - 1 ， -il 和 2 + i 进制的另一个有趣的情况 
[Math. Magazine 57 ( 1984 ) , 250 〜 251 ] 。 关于基于更一般的代数整数的数系的研 
究，请见 I . K4tai 和 B‘ Kovacs y Acta . Math. Acad. Sci ， Hung 37 (1981 )， 159 〜 164 ， 405 
〜 407 ;B. Kovacs y Acta Math. Hung. 58 (1991) ， 113 〜 120 ;B. Kovdcs 和 A. Petho,Stu- 
dia Scient. Math. Hung. 27 (1992), 169 〜 172 。 

19. 如果 m 〉 u 或 ? ，求 a ^ D 使得 m 三 < 2 ( modulo 6); 所求的表 7K 将是 
m = (m _ a)/6 的 一* 个表不后接 a 。 注意 m > u 意殊着 I 〈 m ' 〈 m ; ?n 〈 I 意味着 
77i < m' < u ; 所以算法终止 o 

[当 6 =2 时无解。当且仅当 0GD 时，表示是惟 一的； 例如当 D= { -3, - 1, 
7|，6 = 3 时出现非惟一的表示，因为 U) 3 = (3775a ) 3 。 当 b>3 时，不难证明恰有 

2 6 一 3 个解集合 D ， 其中对所有 aGD 都有 |a|<6 。 而且对所有和 n>l ， 当每 
个。为 0 或 1 时，集合 D 二 \0,1,2~ (3 b\- y b~2~ e b . 2 b\b-l~ Yl 给 

出惟 一 的表示。参考 •• Proc ■ IEEE Symp. Comp. Arith. 4 (1978 )， 1 〜 9;JACM 29 
(1982),1131 〜 1143。] 

20. (a) O.iil … =1.888 …= 了 8:… =18 1 二 ]… = … = 孓 8 … 有 9 种表 


示。 （ b ) —个 “ D - 分式”.〜〜…总是位于 -1/9 和+71/9之间。假设 x 有10种以 
上的 D -10 进表示，则对于充分大的有10 种表示，它们在小数点左边 不同: 


10 


X 


+ /i 


71 L0 



/ lQ ，其中每个/ ; 是一个 D - 分式。由整数表示的惟一性 


可知，力都是不同的，比如说因此 n {0 - 72 ! >9 ;但这意味着 - / io ^ 
9>71/9-(-1/9)，矛盾。（幻形如 0. qa 2 …的任何数，其中每个屮是 -1 或8,等于 
1 . a { a ' 2 …，其中 a ; = a ; 十 9( 而且它甚至还有6种另外的表不 18. a »' ，等等）。 


21 . 通过使用类似于正文中提出的转换成平衡三叉树的方法，我们可以转换成 
这样一种表示。 


与习题20中的诸系统相反，可以以无穷多种方法表示零，全都由 




-4 +卜10 〃（或由这个表示的负值)得到，方法是用10的一个幂乘它。1的 


/ 
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* 


表示是1 





* 




2 




，2 






2 





,50 - 45 -3 





2 



2 


,50 


一 45-4 丄十去 ' 等等，其中 ± 备 * = ( ±4 备 ）（ 10- 1 + 10~ 2 + … ）。 [AMM 57 

2 2 I \ ^ ! 

(1950),90 〜 93。] 

22. 给定某个近似乂…心心，及误差 -：c >10 — 、其中〖>0,我们将 

说明怎样把误差减少约10-、（找出一个适当的>工，即可开始这一过 

程;经过有限次数的减少以后误差就会小于（。）只要选择 r ) i > n 充分地大使得 
-10、的十进表示中在10〜的位置有一个1而在 10- …，10… 2 ，."，10” 的位置 
没有1，则 I 0 m a + (1 CT 和10” 之间10的幂的适当和）+ S ;=( A 10 〜 S := 0 〜10々- 


10一，。 

23. 如同习题18中那样，集合 S = 丨❼ 6 D j 是封闭的，因此它是可测 
的，而且事实上它有正测度。因为 bS = UkdU + 5)，我们有 b ^( S ) = fu ( bS )<： 
S aeD "U + S )= E a 6 D / i ( S ) = V ( S )， 因此当 a ^ a^D 时，我们必定有 / u((a + 

S ) n ( a y + S ))=0 o 现在如果 0 6 D , 则了有测度0,因为： T 是形如夕 U + (U + 
5)门（，+ S )))， a 乒，的可数多个集合的并，它们每个的测度为0。另一方面，如 
同 K . A .Bmkke 所指出的，在习题21的数系中，每一实数都有无穷多个表示。 

[集合了不能是空的，因为实数不能写成不相交的可数多个有界闭集的并；参 

考 AMM 84 (1977) ，827〜828,以及 Petkov§ek 在 AMM 97( 1990) ，408〜411 中更详 

细的分析。如果 D 少于6个元素，则用6进制和取自 D 的数字可表示的集合之测 
度为0。如果 D 有6个以上的元素并表示所有实数，则了的测度为无穷。] 

24. 对于 ^>0,12^*10' + ，|0<0<5,0<，<2丨或|5，‘1(^ + a \0< : a <5,0 

<，<2|。 [R.L. Graham 证明，没有更多的具有这些性质的整数数字的集合，而且 
Andrew Odlyzko 已经证明，对整数的限制是多佘的。这是在下边的意义下说的：如 
果 D 的最小两个元素是0和1，则所有数字必定是整数。证明：设 S =丨I 

是“分数”的集合，并设 X = 丨…心)^〜 GDI 是“整数”的 集合； 则 [0,oo) 
= + + + 有测度0。我们有 （0，1)G 

S ，而且对 rn 用归纳法我们将证明，对某个 A 6 X y rn + 1 ) — + S 0 设： r m G 
X 使得对于所有^ >0 , (7?i , m + 6 ) Pi ( Jo m + S ) 有正的测度，则,而且：必定 
是一个整数以免：」+ S 重叠:^十 S 太多 。如果 ‘ >0,则 （m ~ x m ,m ~ x m + 

in 

1) n S 有正测度这一事实意味着，由归纳法，这个测度为1，而且 （W，777 十 l )^ X m + 
S ，因为 S 是封闭的。如果‘ =0和 （/n ， m 十 1)$S ，对于某个 G X我们必定有 

mCiwCm + l ， 其中 （7 打，但这样一来1十 S 就会重叠:+ S。 见 Proc. 

London Math . Soc . (3) 18 (1978) ，581 〜595。 ] 

注： 如果我们去掉 0€ D 的限制，则还有许多其它情况，它们当中有些十分有 

趣，特别是 U，2,3,4,5,6,7,8,9，10l ， |1 ，2,3,4,5,51，52,53,54,55| 和 i2,3,4,5,6, 
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52,53,54,55,56|。 或者如果允许负的数字，则我们用习题 19 的方法得到许多其它 
的解，加上像 I _1,0，1，2,3,4,5,6,7，18|这样一些不寻常的数字集合。这些数字不 
满足那里所述的条件。因此，不可能为带有负数字的所有解找到一个好的特征。 

25. 一个 b 进表示的正数，其小数点右边有 m 个连续的6 - 1者，必有 c \ b n + 

+ w 的形式，其中 c 和 n 是非负整数且0<0<1。所以如果 uj v 有这一 
形式，则 F = 6，!； + //%-加。因此知是一个整数，它是 F 的一个倍数。但 
是 0 < v 〈 b m 。 [如果 (Xa <6 _ 1，例如在 < 2/(6 _ 1)的表 7 K 中，则可以有任意 

长的其它数字 aaaaa 的一些运行。] 

26. 通过逐步地构造所求的表示，“充分性”的证明是对于6进制的通常证明的 
—个便捷的推广。“必要性”证明分成两 部分： 如果对于某个 n ，/?„ + 1 大于 

则对于小的^ , /? 7 , + 1 - ^没有表示。如果对所有 n ， Pn + k « fSk ，但其中等式不总 

成立，则我们可以证明对某个 jc 有两个表示。 [ 见 Transactions of the Royal Sodety 
of Canada , Series III ,46 (1952) ,45 〜55。 ] 

27. 对 U | 用归纳法证明 :如果 n 是偶 数我们 必须取 以>0, 由归纳法即得结果， 
因为〃/2有惟一这样的表示。如果 n 是奇数，我们必须取4 = 0,问题归结为表示 
-U - 1)/2; 如果它为0或1，显然仅有一种方法进行，否则由归纳法它有惟一的逆 

序表亦 。 

[由此得出，每个正整数恰有两种这样的表示，且带有递减的指数>…> 
y —个〖为偶数另一个 r 为奇数。] 

28. 可以给出类似于习题27的一个证明。注意 a + h 等于 1 + i 乘以一个复整 
数，当且仅当 a + 6 是偶数。这个表示和习题18的答案中讨论的龙曲线密切有关。 

29. 只须证明，满足性质 B 的任何集合17^,7^，了 2 ，…丨均可通过消去某些集合 

丨5 0 ,5 1 ，5 2 ，*"|而得到，其中 S 0 = |0，1，"、&-1丨，而且 Si ， S 2 , …的所有元素是6 
的倍数。 

为证明后一命题，我们可以假定16 了0,而且有一最小元素6>1，使得丁 0 。 
通过对 n 的归纳法我们将证明，如果 M $ To ，则十1，十2，…，72石+ 6 _ 1都不 
在任何了 ； 中； 但如果丁0,则 M + 1， …，4 + 6-1 也是如此。于是得出结果， 
且 & 二 To 丨， S 2 = T \， S 3 = 了 2 ,等等。 

如果72心$ T 0 ，则72心=， 0 + q ，其中 q 山，…是6的倍数；因此 z 0 < 是6 

的一个倍数。由归纳法 ， Oo + 々） + h h +…是72心+ A 的表示，其中0<々<心；因 
此对于任何 j，nb + k 备 T J0 

如果 nb 6 丁 0 ,且设 nb + k 的表示是 〖0 + +…。对于我们不 

能有~ = n 心+々，以免77心+ 6有两个表不 （6 —々）+…十（72心+ A ) +…=(72心）十…+ 
办+…。由归纳法 ， mod 6 =是；而且表示 n 6 = U 0 -々） + q 十…意味着 t 0 = nb 

k o 

[参考文献 : iVieuw Archie / voor Wiskunde (3)4 (1956) ， 15 〜17。 P ‘ A . MacMa 
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hon 推导了这一^结果的有限模拟，见 Combinatoxy Analysis 


(1915),217 




233 


o 


30. a ) 设 A , 是数 n 的集合，其表示不含有;则由惟一性可知，〃 G A , 当且仅 


当 n + 结果，我们有当且仅当 n + 26,6 A ,。 由此得出，对于 片 k ， 

n ^： AjV\ A k 当且仅当 n + 2 bp k Aj Pi 0 设 m 是使得 ( Xt ? < 2 b } b k 的整数 n G A } 
HA , 的个数。则这个区间恰含有 m 个整数，它们在' 中但不在 A 中，恰有 m 个 
在 A 纟 中而不在' 中，并且恰有 m 个既不在' 也不在 中； 因此 4 m = 2 b } b k 0 因 
此 6, 和心不能皆为奇数。但是当然至少有一个是奇数，因为奇数可以被表示。 


2 执 0 因 


个是奇数，因为奇数可以被表示。 


b ) 按照 a )， 我们可以对诸6重新编号，使得 


是奇数，而 


h 


是 偶数； 则 


,… 必然也是一个二进基，而且这 一 过程可以被迭代。 

c) 如果它是一个二进基，则对于任意大的 A 我们必然有正的和负的以便在 

n 很大时表示±2”。反之，可以使用下列 算法： 

51. [初始化]置々—0。 

52. [完成没有？]如果^^^^，则终止^ 

53. [选择]如果 n 是偶数，置 《 — 〃/2。否则把包括在表示中，并且置 

n — (n - d k ) l 2。 

5 4. [增加々] k 增加1并且返回到 S2。 | 

在每步里强制进行 选择； 而且在 S3 中总是减少 Ini ，除非77= -4,因此这个算 
法必然终止。 

d) 在上边的算法中， S2 〜 S4 步的两个迭代将使下列值发生改变 ：4m —m，4m 
+ 1— m + 5 ，4m + 2— m + 7 ， 4m + 3— m - 1 。沿用习题 19 中的论证方法，我们只 

需证明对于 -2< rz<8 算法能 终止； rz 的所有其它值被移向这个区间。在此范围 
中 ，3— - 1— -2—6—8—2—7—0 且 4—1—5— 6。于是 — + 

13-2 3 - 13-2 5 - 13*2 9 + 7-2 10 o 

注 ：选择 ^)，4,4^" = 5，-3,3,5，-3,3，〜也产生一个二进基数。关于进一 

步的细节，见 Math. Comp . 18 (1964) ，537〜546; A. D. Sands,Acta Math . Acad . Sci . 
HungS (1957)，65〜86 0 

31. (也见相关的习题 3.2.2-11，4.3.2-13,4.6.2-22。） 

a) 通过以 2 的适当次幂乘分子和分母，我们可以假定 W = r = 

是 2-adic 整数，其中叫=1。当 n >0 时利用记号 W u) 来代表整数 
( w n _ 1 *** w 0 ) 2 = u mod 2 ”，现在用下列计算方法确定 w : 

设 u ； o=W() 和 t£； (1) = w Q 。 对于 7i = l ， 2 ， … 假定我们已经求得一个整数 w (n) = 
Or r ..，） 2 使得 z/WET/dw^CmoduloY )。 于是我们有 u (n + l) = v (n + {) vu (fl) 
(modulo 2 n ) ，因此根据量 U (” + 1 ) _ i; Cr? + 1) *o; (r,) )mod 2” + 1 是 0 或 2 n ， ％ = 0 或 1 。 

b) 求最小 整数々 使得 2" = l(modu[o 2n + 1)， 则对于某个整数 

2" 、我们有 l/(2n + 1) = m/(2 k -1)。设 a 是 m 的 A 位二进表示，则在二进的系 
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4.1 节 


统中（0._^") 2 乘以+ 1是 （0.111 … ） 2 = 1，而在 2-adic 的系统中 （."aaa ) 2 乘以 

2 n + l 是（… 111)2 二 _ 1。 

c) 如果 w 是有理数，比如说 w = ml ( 2 e n ) ，其中 rz 是奇正数，贝 1 j w 的 2-adic 表 
示是周期的，因为带有周期展开的数的集合包括 - 1/n 而且在取负、除以2及加法 
运算下是封闭的。反之，如果对所有 N> … w + A = WN ， 则 2-adic 数 (2 A -1)2 -〜是 

一 个整数。 

d ) 形如（… W 2 im 1) 2 的任何数的平方都有（•••001) 2 的形式，因此这个条件是必 

要的。为证明充分性，我们可以使用下列过程来计算 72mod8 = l 时的 

H 1 • [初始化] 置 m — (n _ 1)1込， k —2 ， — 1， t ^ i ^ O —1( 在这个算法运行 

期间，我们将有 w = ( % - 1… A 叫)2和 v 2 = n - 2 k + [ m ) 0 
H 2 •[变换]如果7?2是偶数， 则置％ — 0, m —m/2。 否则置 T4 — 1， m —( 爪 _ 

v - 2 k - ') 12 ， v — v + 2、 

H 3. [增加々]々加1并返回 H 2。 | 

32 . 一 个更一般的结果见 Mafh. Comp . 29 (1975) ， 84 〜 86。 

33. 设是所有使得 t = IKJ 的72位数的集合。如果 S 和 T 是任何整数的 
有限集合，如果对于某个整数 x，S= T+x， 我们将说 S 〜 T, 而且我们将写 k n ( S ) 
= H( S )|, 其中尤 （ S ) 是〜 S 的&的所有子集的类。当72=0时，除非 IS |<1 
我们有 h ( S )=0, 因为0是仅有的“0位数字”数。当/2>1和 S= 丨 51 ，…， 八丨时，我 
们有 

^K n (s) = U U i Uj + ^，…，^ + a r 1 

< b ( u i , …，〜） 

U 1 ，…， 1 G I + j ~ a ,) lb I 1 ^ z ^ r I ) I 

其中内部的并是对于满足条件〜 Eh + j ( mo dd 0 6) 的所有数字 （〜，"•， 
a ,) 序列进行的。在这个公式中，我们要求对于 l < f < z"<r , ~ - I = ( s { ~ a { )/b - 
( — 所以下标的命名是惟 一 '确定的。因此，由容斥原理，我们有 k n ( s ) = 

-ir _1 /( S,m，J_)， 其中 /(S,m,_;) 是整数集合的个数，这些整数 

对于 m 个不同的序列（以 ，… ，〜） 可以按上述方式表 7K 为 Ui 6 +力 ，…， +〜丨 ， 
求和是对 m 个不同的序列 ，… ，〜）的所有选择进行的。给定 m 个不同的序列 
( a \ l) , ••- , a { r L) ) ，这样集合的数目是 - i( I (s, + > - a\ l) )!b | 

于是有集合的集 9( S ) 使得 

k n ( S ) = X) c J k n ^ l ( T ) 

T6 O ( S ) 

其中每个 C T 是一个整数。而且，如果丁 G^(S)， 则它的元素都是接近于 S 的那些 

元素；我们有 minT^(minS - maxD )/6 和 maxT ^ (maxS + b ~ 1 ~ minD )/6。 于 

是在习题19的记号下我们得到对于序列 UJS)〉 的联立递推关系，其中 S 跑遍[/， 
M + 1] 的非空整子集^由于对于任何一个单元素集合5，匕=^ 7 (5)，序列〈0在这 
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习题答案 


些递推式中出现。由 Ms ) 的开头几个值可以计算系数 c T ，所以我们可以得到一个 
方程组，它定义生成函数 k s ( z ) = Xk n ( s ) z 71 = [I S|<1] + zS T ea ⑸ MtU ')。 
[参考/ ■ A/goWt/ims 2 (1981) ， 31 〜 43 。 _ 

例如，当 D = 丨 _ l ，0,3 l 和6 二 3时，我们有/ = - ■和 w = ^ ■，所以有关集合 S 

是 i 0|，|0 ，lU - l ， ll 和丨 _1，0，1|。对于72<3,对应的序列是〈1，3,8,21〉，〈0，1， 
3,8>，〈0,0，1，4>,和〈0,0,0,0；) ; 所以我们得到 

々 0 (2) = 1 + Z ( 3 k Q ( Z ) - k 0 [ ( z )) ,々02(之）=之（々01(之）+ 々02“）) 

々 01 ( Z ) = zk 0 ( z ) y 焱 012 ( Z ) = 0 

而且 k ( z ) = 1/(1 - 3之 + z 2 ) o 在这种情况下 h = > F2r7 + 2 且 = ( i 0»2 I ) = F 2 n -\ ~ 
1。 

34. 在符号|了，0，11上恰有一个串 〜 使得 n 二 （ aj 2 而且〜没有前导的零或连 

续的非零： a Q 是空的，否则 a 2 „ = a „ 0 , a 4n + 1 = a n 0 l , 0： 4 „ - i = 通过使用变换 lT 

— oi ， Ti — oT ， oi … ii — io ." oI ， oI — IT — To … oi , 以及插人或删去前导零，任何表 
示；2的串都可被转换成由于这些变换并不增加非零数字的个数，因此^有最 

少数字 。 [Advances in Computers 1 (1960) ,244〜260。 ] 以 5(/7) 表不 中的非零数 

字的个数，它是紧前边有0或者对于某个々>0,有子串 00(10)4 居前的通常表示中 
1的个数。 

对于 b >2 进制的 一 个推广已由 J . von zur Gathen 给出 ， Computational Com ¬ 
plexity 1 (1991)，360 〜394。 


4.2.1 小节 

1. N = (62, + .60 22 14 00) ； h = (37, + .66 26 10 00)。 注意， lO/i 将是 （38, 
+ .06 62 61 00)。 

2 ‘ b E — q ( l - b -”， br q - p ' b E — q ( l - bi 、， b- q — 1 。 

3 . 当 e 没有其最小值时，最高的 “1” 位（它出现在所有这样规格化的数中）不必 
出现在计算机字当中。 

4. (51，+ .10209877);(50, + .12346000);(53, + .99999999)。如果头一个操 
作数曾是（45, - .50000000)，则第三个答案将是（54, + . 10000000) ，因为6/2是奇 
数。 

5 . 如果 y 且是一^个整数，则+ x 〜+ : y ， 而且通过考虑所有可能 
的情况 ， : r 〜: y 意味着 x/6 〜 : y/6 。 另 一 个关键的性质是每当 boc 〜 by 时，和: y 将舍 
入成相同的整数。 

现在如果关夂，我们必定有（/^ + 2 人 ） mod 6关0 ;因此除非>2 , 

否则这个变换保持 A 不变。由于〃是规格化的，它是非零的且 IA +Al - 

b _ 2 > b - 2 ' 人+人的前导非0 位必然至多在小数点右边两位，而且舍入操作将把 
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4.2.1 小节 


人十.尺）转换成为一个整数，其中如果我们能够证明 ^ +J + 1 (/ u + /J 
〜沪 +; + i ( 尤十圮），则证明将完成。由前段，我们有 ^ +2 (A + / J-^ +2 / w + 

V + 2 (人 + 它意味着对所有 J <1， 得出所求结果。类似的说明适用 

于算法 M 的步骤 M 2。 

注意，当6>2是偶数时，这样一个整数总 存在； 但当 b 二 2 时，我们要求多+ 
3位（令 2 P ； 是一个整数）。当6为奇数时，整数圪总存在，除非在除法的情况下和 


可能有+ 6的余数时。 

6 . (考虑程序 A 中 e u = e v ， f u = _ f v 的情况。）如同在 ADD 中一样，寄存器 A 保 
留它以前的符号。 

7 . 说一个数是规格化的当且仅当它是零或它的小数部分在+< 1/1 ■的范 

围内。对于加法和减法来说 （P + 1) 位累加器就足够了 ；舍入（除在除法期间外）等价 
于截取^确实是一个非常合意的系统！我们可以用超0指数表示这些数，在分数的 
头一个和后继数字之间插人这个指数。而且如果这分数为负，就求补，使得定点的 

顺序保持不变。 

8. ( a )(06， + .12345679) ㊉ （06，- .12345678), (01 ，+ • 10345678) ㊉ （00 ， 
— .94000000); ( b ) (99，十 • 87654321 ) ㊉ 它本身， （ 99，+ .99999999 )0(91， 
+ .50000000)。 

9. a = r = ( _ 50, + .10000000)，6 = ( _ 41，+ . 20000000 ) y d = ( _ 41， 

+ .80000000) ，》=(11，十 .10000000 )o 

10. (50, + . 99999000) ㊉ （55, + .99999000)。 

11. (50, + .10000001) ③（50, + .99999990)。 

12. 如果 0< |/„ | < l./'J J'J —6— 因此 llb<\f u lfj<l-b~ p l 

|人|<1 -61。如果0< I f v I < I f u I ，我们有 Hb< I f u lf v \lb<((i- b- p )KH 
b)、lb = i- b — p 。 

13. JaL J . Michael Yohe y IEEE Transactions C _22( 1973) ， 577 〜 586 ; 也参考习题 


4.2. 2-24 0 

14. FIX 


STJ 

9F 

STA 

TEMP 

LD1 

TEMP(EXP) 

SLA 

1 

JAZ 

9F 

DEC1 

1 

CMPA 

= 0 = (1 ： 1) 

JE 

-x* — 4 

ENN1 

-Q — 4，1 


浮点化定点子程序 

rA— 土 ffffO 

输人为0? 

如果前导字节为0, 
则再进行左移 
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习题答案 


15. 



J 1 N 


ENTX 


SRAX 


CMPX 


JL 


JG 


JA 0 


STA 


INCA 

9 H 

JMP 

FP 

STJ 


J 0 V 


STA 


ENTX 


SLA 


LD 2 


DEC 2 


J 2 NP 


SLA 


ENT 2 


JANN 


ENN 2 


SRAX 


ENT 2 


JXNZ 


JAZ 


INCA 


ADD 

1 H 

INC 2 


JMP 

8 H 

EQU 

WM 1 

CON 


FIXOVFLO 

0 

0,1 

= 1//2 = 

9 F 
* + 2 
9 F 

*+ 1 ( 0 : 0 ) 


EXITF 

OFLO 

TEMP 

0 

1 

TEMP ( EXP ) 

Q 

*+ 3 
0,2 
0 

IF 

0,2 

0,2 

0 

* + 3 

关十 2 


数量太大吗? 


含混的情况变成奇数，因为6/2是偶数 

必要时，进行舍人 
加 ±1( 不可能溢出） 

从子程序出口 ■ 

小数部分子程序 
确保溢出开关断开 

TEMP — w 


rI 2— ^ 


消去 w 的整数部分 


小数部分为负，求它的补 


WM 1 加字长减1 

Q 准备把答案规格化 

norm 规格化，舍人并出口 

8 B -1，8 B -1(1:4) 字长减 1 


16. 如果 |c|>|d| ，贝 U 置 r^~d —c ㊉ —(a ㊉ （6 ② r))0 — 

(6 ㊀ （ a(g)r)) 0 s 。 否则置 r*~c 0 d ㊉ （ r ③ c ) ; 上 ― （（ a ⑭ r )® 6 ) 0 5 , 50 

r) ㊀ a)0 s。 则： c + iy 是所求的 （ a + 6i)/(c + di) 近似。 [CACM 5 (1962),435。 

P.Wynn 给出了对于复数运算和函数求值的其它算法，见 BJT 2 ( 1962 ) ，232〜255 ; 
也见 Paul Friedland,CACM 10 (1967),665。] 

17. 见 Robert Morris,/EEE Transactions 020 (1971 )，1578 〜 1579。对于这样 
的系统，误差分析更为困难，所以区间算法也更符合要求。 
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18. 对于正数:小数左移直到 /i = 1，然后进行舍入，然后如果小数为 0( 舍人上 
溢），再次右移。对于 负数： 小数左移直到 ， =0,然后进行舍人，然后如果分数为0 
(舍入下溢），再次右移。 

19. (73- (5 - [舍入数字为 ] )(6- [量被向上舍入])+ [〜 <、]+ [头 一 

个舍入数字是音]-[分数上溢]-10[结果为 0] +7[舍入上溢] +7 N + (3+(16 + 

[结果为负])[相反的符号]) X 〃，其中 N 是规格化期间的左移次数， X 是条件 rX 接 

收非零数字且无分数溢岀。例如当 

u = - 50 01 00 00 00, ^ = + 45 49 99 99 99, b = 100 

时，出现极大时间 84 z /。 [考虑 4.2.4 小节中的数据，平均时间将小于 47^ 0 ] 

4.2.2 小节 

1 . uQv = w ㊉— v — ~ ㊉ W = — ( T； ㊉ -w ) = — ( V ㊀ U ) 。 

2 . 由（8)，（2)， （6) 可知， w ㊉: c > w©0 = w ; 因此再次使用（8)，得 （ w ㊉ : c) ㊉ 
U 。 类似地， （8) 和 （6) 连同 （2) —起，意味着 （ W ㊉: c )0( u ©： y )>( W ㊉ JT ) ㊉ T ；。 

3 . w = 8 • 0000001 ,v = \. 2500008 ，比 = 8 • 0000008 ；( u ^> v)^>w = SO . 000064 ，而 

w ® ( ③ ttO = 80 • 000057 o 

4. 是的； 令 w 很大。 

5. 不 总是； 在十进算术中取 u = v = 9。 

6 . ( a ) 是。 （ b ) 仅对6 + f <4( 试验 u = l - b - p ) 0 但请参见习题27。 

7. 如果 w 和 r 是相继的浮点二进数， w ㊉ z ； = 2 w 或2^。当它是2^时，我们通 
常有 w ②㊉ r ② <2。②。例如 ， w = (•10〜001) 2 ， t ；= (.10 …010 ) 2 , u ㊉ v =2 r , 且 

w ② + ② = (.10"-011) 2o 

8 . a ) ^ ^ ； b ) 〜，&;<:) ^ ^ ; d ) — ; e ) 〜。 

9 . |w-w|<|w — + \v ~~ w\ ^ q min( b e ^ ~ q ^ b e ^~ q ) + 62 m i n ( b e ^~ Q , b e ^ - K 

i 十 — 这个结果一般不能加强，因为比如 

说相对于^ 和& 两者，我们可能有非常之小的而这意味着，在这个假设之下 
u - w 可能相当大。 

10. 如果 〜 和 q ， 则我们有 （ . a 1 … 〜 ) 6 0( .9 … 99 ) 6 = ( . 〜 … 
a p - x ( a p ~ 1)) 6 ; 这里 “9” 代表 b ~ 1 0 且 （.〜…％”〜八③ （1.0 •••0) 6 

0 ) 6 ，所以如果6>2和〜>1+ ，则乘法不是单调的。但当6 =2时，这个 

论证可加推广，以证明乘法是单 调的； 显然“某台计算机”有 b >2 0 

11 . 不失一般性 ，设: c 是一个整数， 0<： r < 沪。如果则 i =0。 如果 0< e < 
f ，则 : c - ^至多有 p + 1 个数字，最低有效位为0。如果 e >/)， 则： r - £ = 0 。[在更弱 
的假设 \ t \< b e 下，这个结果也 成立; 在该种情况下，当 e > p 时我们有 x-t = b \] 
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题答案 


12. 假设匕 


p ， w >0 


情况 l ， u > b p 


一 1 


情况 （ la )， tt > = w + 1, v ^~2 y 


0,则 u — u 或 w + l ， t / 




1, u 


// 

U , V 




1 或0。情况 （ lb) ， w 


U y I V I ，贝 1 J 


li = U ， V = 0 ， 


u 


U ， V 


0 


如果 11; 


2 


，而且允许更一般的舍入，我们也可能 


有 二 w ± 1 ， 


V 


+ lo 情况 （ lc) ， W - 1，— 


2 


，〜 = 0,贝 ! J u — u 或 w _ 1， 


V 


— 1 y II 


U j V 


-1 或0。情况 2 ，w 




h p 


-i 


情况 （2 a )， w = w + 






0,和 （ la ) 类似。情况 (2 b)，w = t /, I ^<+， 1 /> 1 /，和 （1 b ) 类似。情况 （2 c)，m 


u , \ v 了， i /< w 。 于是 u — u 其中 v -]\ b ^ Vl I v i ■石 _1 ， 其中 


6 是某个正整数。我们有 j / 二 0 ， = w ， t ;〃 = j / Z ? 。情况 （2 d) ， w < w ，则加 =w 


— jib ，其中 r = - jib 



v 


和 


V 


去 r 1 ， 其中 j < b 是某个正 整数； 我们有 （ r /， 


u 


-j I b , u )^\( u / , v 


u 


， -jib)m( 


u 


-1/6 ， （ 1 — j )/6 ) ，后 一 情况仅当 w 





b 


- 1 


时才出现。在所有的情况下， we / 


u 


u , vQv — v 


V'， u Q u " = u 


u y v ㊀ v = v 


V 


， round ( w — u ~ v ) 


zv 


u 


V 


13 .由于 round (x 


0 当且仅当： c =0, 因此我们要来找整数偶 （ w ， n ) 的一个很大 


的集合，它具有如下的 性质 ： m 0 n 是整数，当且仅当 min 是整数。假定| m 


w I 如果 ml n 是整数，则 m 0 n 


ml n 也是。反之，如果 min 不是一^个整 


数，但 m 0 72 是，则我们有 1/1 w |<| m 0?7 - ml n \ K — \ m\n |办 1_ ^ > ，因此|?? 1 |〉 


2 b p 


一 1 


。因此我们的答案是要求 


一 1 


和0< rz < b p 。 (稍弱些的假设也是 


可能的。) 


14 . I ( U<S>v)<^W - UVW I ^ I ( U<S>V )^ZV — (u<S>v) UU I + ZV U0v - uv l< 

^ w 认谷 u ③ v( 1 + ^ ^ ^ ( u®v)^)zu 0 I ^ ( u^iv)^>iu ^ u®( v^w) ^ 


以我们可以取 




2 


(1 



b)b 


2 - p 


15 . u^：v 意味着 （ w ㊉ w )0 2^( ) 0 2^( u ® tO 0 2,所以这个条件对所有 


的 W 和 u 都成立当且仅当每当 u 


V 


时它成立。 





2,这个条件总 
U)®VU , 因此这 


是满足的（不包括溢 出）； 但对于6>2,有一些数1关 W ， 使得 r ㊉ r =加 ㊉ w , 因此 i 
个条件不成立。[另一方面，公式 u ® avQu )0 2) 确实给出了正确范围的中间点 


o 


证明：只需证明^ 



(vQu ) 0 即（幻 ㊀ w)0 Kv 


而且容易验证，对所有 


的, round (了 round ( x ) 。 
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4.2.2 小节 


16. ( a ) 指数变化出现在2 10 = ll . Uim ， S 9l = 101.11111， S 901 = 1001.1102, 
S9001 ~ 10001 • 020， S90009 = 100000.91， S900819 = 1000000.0; 因此 Sioooooo = 


1109099.1 0 

( b ) 在计算 2/^1. 2345679 = 1224782.1 之后， （14) 试图取- .0053187053 的平 
方根。但在这种情况下 （15) 和 （16) 是精确的。[如果 a = 1 + LU -1)/2」10_ 7 , 


(15) 和 （16) 有 n 阶误差。对于标准差计算的进一步精确结果见 Chan 和 Lewis ， 


CACM 22 (1979),526 〜531。] 

(C) 我们需要证明 W ㊉ （ Uew )0 k ) 位于 W 和 t; 之间；见习题15。 


17. 


FCMP STJ 9F 

JOV 0FL0 
STA TEMP 
LDAN TEMP 


浮点比较子程序 
确保溢出开关断开 



V 


(这里照抄程序 4.2.1 A 的行 07〜 20) 

LDX FV (0：0) 置 rX 为 0并带人 的符号 


DEC1 5 
J1N * + 2 
ENT1 0 


以较小的差代替指数中大的差 


SRAX 5,1 

ADD FU rA— 操作数的差 

JOV 7F 小数溢出 ：非〜 


CMPA EPSIL0N(l ： 5) 


JG 8F 

JL 6F 

JXZ 9F 

JXP IF 

JAP 9F 

JMP 8F 


若非〜，则转移 
若是〜，则转移 
若是〜，则转移 

如果 | rA | '则校验 rAXrX 的符号 
若是〜，则转移。 ( rA ^ O ) 


7H 

ENTX 

1 


SRC 

1 


JMP 

8F 

1H 

JAP 

8F 

6H 

ENTA 

0 

8H 

CMPA 

=0 

9H 

JMP 

•X- 


使 r A 非零并有相同符号 

若不是〜，则跳。 ( rA ^ O ) 

置比较指示符 
从子程序出口 ■ 


19. 设对于，八=心=% =以= 0。只须求&的系数即可，因为除所有下 
标都增1外， A 的系数与它相同。设 （/& ， A ) 分别表示 （ 4 q ) 中：的系 

数，则 /i = (1 + ^ 1 ) ( 1 - 7 i _ 7 i^i _ 7 \^\ ~ 汐 1。1 _ 7 i ^ i ^ i ) , gi = (1 + S y ) (I + rj x ) 

( y\ 十 a + ，以及 / 々 =(1 — y^k ~ ~ y^k^k)fk- \ (7k - Vk + y^k + 八％ 十 
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习题答案 


7 k S k rj k + 7 k rj k a k + 8 k 納 + VtAWk) gk - \ ， gk = ^ (1 + 7^ ) (1 + ^ ) A - i ~ (1 + ^ ) ( ^ 
+ ik ^ k + + ykVk ° k )心-1，1〈々<打。于是 /« = i+ 々1 _ /i + ( 第一阶的 4” 项）十 

(更高阶的项 ） =1 +仍 _ 7 i 十 0( m 2 ) ，这个数充分小。 [ Kahan 的求和公式首先发表 
在 CACM 8 (1965) ，40;也参考 Proc.JFJP Congress (1971) ，2， 1232 ， 以及由 K . Ozawa 
^.Information Proc 6 (1983)，226 〜 230 上论述的进一步发展。关于精确求和的 
另一个方法，见 R . J . Hanson,CACM 18 (1975) ，57 〜 58。当某些 ： r 为负而其它为正 
时，如同由 T • 0 . Espelid 在 SIAM 尺 ev!ew 37 (1995) ，603〜607中所说明的，我们可 
以有利地匹配它们。关于给定丨〜，…， x „|， 精确地计算 mimcUA +…+工，）和 
round (: c 1 … ) 的 一 些算法，也可见 G . Bohlender , IEEE Trans * C ~26 (1977),621 〜 

632 0 ] 

20. 由定理 C 的证明，仅当 I r I + I te; - w I — 1 + 6 _1 时， （47) 对 = p 


才不 成立； 因此 I A - ( + 6 我们现在求出在规格化过程期间 

对于失灵的一个必要和充分的条件是I九I实质上舍入成 2( 实际上在用于分数溢出 

的右调之后成为 21 b ) ——这确实是一种非常稀少的情况！ 

21. (G.W.Veltkamp 给岀的解）设 c = 2「 W21 + 1;我们可以假定户>2,所以 c •是 

可表示的。首先计算 W ， W 1 = ( W ㊀ W ，“：二“ ㊀ “^类似地 ，。 = v ^ c y 

W = (。 ㊀ ^乃 ㊉ ^/ ，％ = pQ %。 然后置 W — W 0 T ；， 切 / — ^②巧）） 

®( ) )®( U 2® ^2 ) o 

只须当和〜使得 w 和 r 是属于 [2 P_1 ，2 P )W 整数时，证明这 

—^点即可。于是 w = 十 “2,其中 2 p ~ l ^ uy ^：2 p y u \ mod 2「W 2 = 0 ，且 | I < 

2「W 2 V 1 ; 类似地， 1； = t^ + U 2。 在计算期间运算是精确的，因为是 

2^ 1 的倍数，使得 | 加- u x v l | ^ | W — UV I + I UiV\ + U\V <1 U 2^2 I < 2户 1 十 

2 p + [pl2 ^ +2 /) 一 1 ;而且类似地|切—“ 1 幻 1 — “ 1 1 ； 2 丨<丨 < ^ —抑1十 \ u 2 v \ < 2 P 1 + 

2「/>/21 - 1 + />，其中 w — U{Vl — W 02 是的倍数。 

22. 我们可以假定 b p — 乂 如果㈣ 则：其中 M < 


— 1 ，因此 x 2 — round ( u - rl v ) = 

意味着 v — i ， 因此 r = 0)。 如果 


工 0 ( 因为 I W _1 <+ ，而且等式 

— 1 ，则：其中 + 


此: cj 幻 = w - 厂/幻 < 6々十士 6 且:如果 工：二 b p 则: C3 = 71 ( 因为条件 （W - 

bv < x x 意味着 A 是沪的倍数，而且我们有 A<//U + |))。 如果： r 2 < y 和 
2 L 

:^ >6 2；5 - 1 ，则令上 2 = a / z ; + <?，其中 I g I <皆;我们有 A = rouncKo ：! + qv ) = x [0 最 


• 584 



4.2.2 小节 


后如果= 6 2/) — 1 和 ： c 3 < 6 2p _ 1 ，则由上述头一种情况可知 ： c 4 = x 2 。 比如 

说，当 b = 10 y p = 2 ,u = 19 ,v = 55, x 1 = 1000 ,^ 2 = 18,^3 = 990时，出现这种情况。 

23. 如果或 - 1，我们有 u Cm 3 >l = u mod 1，所以恒等式成立。如果 
_ 1 <“< 0 ，则“ Cm^>l = _1 =以+ 1 +厂，其中 | 厂 | <士 6 1 ;这个恒等式成立当且 
仅当 round ( l + 0 = 1 ，所以如果我们舍入成偶数它总成立。利用正文的舍入规则这 
个恒等式不成立当且仅当 6 是4的倍数及 - 1< w < 0且 u mod 2 b ~ p ~ (例 

如，夕= 3 ,6 = 8, w = - (• 0124 ) 8 )。 

24•设 w = [〜， w r ] ， t ； = [ %， tv ] ，则“ ㊉。=[〜 W v n u r A ] ，其中对所有 x ， 

x A y = y Ax t x = : r ，对所有 + 0 ,x A - 0 = 工， 对所有： c # - ⑺ ，：c A + 

°°= +°°，而且 1 A - oo 不必是有定义 的 ；: r ▽ 3 ；=-((- : c ) A (- 3 ；))。 如果在通 
常的浮点算术运算时，由于 ： c + y 太大，因而 z ㊉ y 将溢出，则 ：c A ： y 是十 00 而且 ：c 

是可表示的最大数。 

对于减法，设 U (3 v = W ㊉ （-。），其中 - 1 = [ — IV ， - v L ] 0 

乘法稍微复杂一点，正确的过程是设 

u ® V - [ mm { u l V v L , u t V v r ) u r V v n u r ^ v r ), 

max ( u t ^ v t y Ui A v r ^ u r A ^ , w r A )] 

其中 x A 3 ； = A x A ( - 3 ；) = - (x V >；) = ( - x ) A A 十 0 二 （+0, 对： c > 
0 ， _ 0 ,对 ： c < 0);：c A — 0 — — (x A + 0) ； x A + oo = ( + oo 对 ： c >+ 0 ，-°° 对 x <C 

_ 0 ) 。（有可能只需考察 〜 ， w r ，巧和％的符号就能确定 min 和 max , 由此只计算八 

个乘积的两个，除非当 u L <0< u r 和％ < 0 < i ； r 时； 在后边这种情况下，我们计算四 

个乘积，而且答案是 [ min ( w , ▽ v r y u r ^ i > i ) , max ( ui A vi y u r A ) ] 0 ) 

最后，如果％< 0 <%,则 w Or 无 定义； 否则我们在乘法公式中分别以和 

代替 ％ 和 D r ， 其中 ： c ^ y ~ ^ = x A y y x ^ y l ~ x Vy ，（土 0 ) _1 = 土 oo ， 

(土 oo )- l = ± 0 。 

[参考 E . R . Hansen , Mai Comp . 22 (1968) ， 374 〜384。另一个方案（其中除以 

0 不给出出错信息而且区间可以是 oo 的邻域）已由 W . M . Ka / mn 提出。例如，在 

Kahan 的方案中， [ -1， + 1 ] 的倒数是 [ + 1， - 1]，而且一个含0的区间乘以含⑺的 

区间产生[-⑺，+ °°]，即所有数的集合。见 Mmiehca ] Analysis , Univ . Michigan 
Engineering Summer Conf . Notes No . 6818 (1968)。] 

25. 量的删除揭示了前面计算 w 和 r 时的误差。例如，如果 f 很小，当计算 
/( 工+ 0㊀ /(: r ) 时，我们通常得到很差的精度，因为 f( x + d 的舍入计算破坏了许 
多关于 e 的 信息。 最好把这样的公式改写为吻 g ( K )， 其中 ^( x,0 = (/(x + .) 
- f ( x )) h 首先以符号方式进行计算。于是如果 f ( x ) = X 2 g(x ,() =2 x + 

果 , J 3 !j g(x } () — 1/(\/ x ~ (： + \ f ~ x ) o 

26 • 设 e = max ( e u ， e u '、 ， e , = max ( e v ， e v '、 ， e 〃 = max(f ㊉〆 ）， 并假定 g = 
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题答案 



o 于是 （w ㊉ ㊉ + r + 





b 


u 


V 


+ 


2 



^ b e + ^ + b e 


以及 e 〃> max ( e ， 〆 ）。 因此 u ㊉ v 




“’ ㊉ ^/ (2^ + 



)o 


如果办 

反的符号^ 




2,这个估计可以被改进成 1.5 



b 


因为如果 t / 


以和 I ； 


i / 有相 




>是一个上限，而且在其他情况下我们不能有 e 


/ 


O 


U 


27. 所述的恒等式是以下事实的一个结果，即每当 f 

如果后一结果不成立，则将有整数： c 和^使得沪 


<人<厂 1/2 时，1 0(1 0 
_1 <2<6〃 1/2 ,以及或者 





( b lp 


一 1 /：r < b 2 p ^ l l(x - i ^ r)^y 或者 y ^ b 2p ~ x !{x + 


2 



)< b 2p ~ l lx 


^3 ; + 





但是除非我们有： r (: r + +)>6 2 ^，否则这显然是不可能的，这后一条件意味着 y 


lb P 


- 1/2 


X o 


28. 参 32 (1978),227 




232 o 


29 •当卜 2 和 p 


1 且: c >0时，我们有 round (: c ) = 2 


6K X 


，其中 e ( x ) 




Ug 


4 



: C 」。 


令 /(工）=/ 且令 n ) = LLan + lg 冬 」 /a + lg 4」。于是 A (2 e ) = 2 心)。当 of =.99 


时，对于41 <^<58,我们求得 h ( 2 e ) = 



e - 1 


31. 按照 4.5.3 小节的理论，连分数 W 



//1，2，1，2, 


» * « 


//的收敛式是 p n iq n 


K ” + 1 ( l ， l ，2， l ，2，〜）/ i ^( l ，2， l ，2，〜）。 这些收敛式是对 V 3 的极好近似，因此 


;事实上 ，3 <? 2 n - 义 


2-3(72 mod 2) 0 给岀的例子是 



Oqii ~ ph ) 


Oq 


31 



ph ) 


^P\\ _ (^31 ~ 1 



^ l ) 


1。从 3 d , 减去的浮点减法产生零，除非 


我们能几乎完美地表示从减去 


般地给出比2/4大得多的舍入误 


差。类似的例子可以基于近似于任何代数数的连分数给出。 


4.2.3 小节 

1. 首先， 


W 


m 


Wi 


• 573, .248); 其次 




.290; 所以答案是 （.572, 


.958)。这个结果精确到6位十进数字。 

2. 答案不受影响，因为规格化子程序截断到8位而且绝不会考察这个特定的 
字节位置。（规格化时左调顶多出现一次，因为输入是规格化的。） 

3. 在行09处上溢显然不可能出现，因为我们正在做双字节量的加法，也不可 
能在行22处出现，因为我们正在做四字节量的加法。在行30中，我们计算的是三 
个四字节量之和，这不可能溢出。最后在行32处，溢出不可能，因为乘积/上必须 

小于1。 


4. 在行03和04之间插入 “JOV 0 FL 0; ENT 1 0”。用 “ADD TEMP( ABS ) ; JN 0 V * 



2 


INC 1 1”代替行21 




22,并把行28〜31 改为 “SLAX 5； ADD TEMP ； JN 0 V * + 2 ； INC 1 1 



TX 0，1; SRC 5”。 这样做只增加 5 行代码而且仅增加1，2或3个执行时间单位。 
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4.2.3 小节 


5. 在行 06 之后插入 “JOV OFLO” 。 分别改变行 22,31 ， 39 成为 “SRM0 ， 1”，“SLM 

5”， “ADD ACC ”。 在行 40 和 41 之间插入 “DEC2 l；JNOV DN0RM ； INC2 1; INCX 1；SRC 1 ”。 
( 删去 “DEC2 1” 而加进 “STZ EXPO” 是有吸引力的，但那样 “INC2 1 ”可能使 rI2 溢出！） 

这样做将增加 6 行 代码； 运行时间减少 3^ ，除非有小数溢出，那时它增加 7 ^。 


6 . 


DOUBLE STJ 

ENTX 

STA 

LD2 

工 NC2 

STZ 

SLAX 

JMP 

SINGLE STJ 

JOV 

STA 

LD2 

DEC2 

SLAX 

JMP 


EXITDF 

0 

TEMP 

TEMP(EXP) 

QQ-Q 

EXPO 

1 

DNORM 

EXITF 

OFLO 

TEMP 

TEMP(EXPD) 

QQ-Q 

2 

NORM 


转换成双精度 
清 rX 

rI2^~e 

校正余量中的差 
EXPO— 0 

去掉指数 

规格化并出口 

转换成单精度 
确保溢出开关断开 


rI2^~e 

校正余量中的差 
去掉指数 

规格化，舍入并出口 I 


7. 所有三个程序都给岀0作为答案当且仅当精确的结果为0,所以我们不必担 
忧相对误差的表达式中的0分母。加法程序最坏的情况是相当糟糕 的：在 十进制 
下，想像如果输入是 1.0000000 和.99999999,则答案是而不是因此极大 

相对误差心是6 - 1，其中6是字节大小。 

对于乘法和除法，我们可以假定，两个操作数都为正而且有相同的指数通 
过考察图4,容易限定乘法中的极大误 差：当 uv>llb 时，我们有0< u ® v < 
36- 9 + (6 - 1)6 _ 9 ,所以相对误差以 +2)6 _ 8 为上限。当 llb 2 < uv<llb 时，我们 
有 ()<■ - 在这种情况下，相对误差以3纟_ 9 /奶为限。我们取 

I 为两个估计中之较大者，即 3 b - 1 。 

除法要求对程序 D 做更仔细的分析。实际上由子程序计算的量是 a - d _ 

& ( ( a - V ) (/? _ S ) _ O — \ ， 其中 a = ( u m + ai L )lbv m v t \bv m ，而且非负截断 

误差 U ，( T ， r ， f ) 分别小于（^'6_ 5 乃_ 5 ,厂 6 );最后 1( 规格化时的截断误差) 

是非负的，并依赖于是否出现调整而小于6 或 b ' 商的实际值是 al ( l + b ( p ) 二 

其中 r " 是由无穷级数 （2) 的截断引起的非负 误差； 这里 r <& 
—^ ~ 10 ,因为它是一个交错级数 d 因此相对误差是 （ + b (8 "p I a 十 beS^I a ) ~ (Si a 

+ MT/a + 6 2 浐 ( T 〃+ l / a ) 的绝对值，乘以 （1 + 邮 h 这个表达式中的正项以 r 9 
+ 6_ 8 + 6— 8 为界，负项以 6 — 8 + 6 — 12 + 6_ 8 加上规格化阶段的贡献为界。规格化阶 
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- -- 

段所贡献的数量大约为 b - 1 。 因此显然可能出现的相对误差的最大部分来自规格 
化阶段，而且心 =(6+2)6— 8 是相对误差的可靠上限。 

8. 加法 ：如果 则在规格化阶段整个相对误差出现，所以它以 b - 1 % 
上限。如果+ 2,而符号又相同，则整个误差可以再次归咎于规格化；如果符 

号相反，则由于把数字移出寄存器之外而产生的误差同随后在规格化时引进的误差 
有相反的方向。这两个误差都以6 _7 为限，因此心二6 _7 (这 实际上 比习题7中的结 

果更好）。 

乘法：与习题7类似的分析给出 §2 = (b 2) b 8 0 

4.2.4 小节 

1. 由于仅当操作数有相同符号时才会出现小数溢出，因此这是小数溢出的概 
率除以操作数有相同符号的概率，即7%/(+ (91%))〜15%。 

3 . log 10 2 . 4 - log ^ 2 . 3^1 . 84834 % 0 

4. 这些页将是均匀地灰白的。 

5.10 / c/ <r 的概率是 （ r _ 1)/10 + ( r _ 1)/100 + ••‘ = ( r _ 1)/9。所以在这情况 
下前导数字是一致地分布的。例如前导数字1以概率+出现。 

6. 有三个前导0位的概率是 log ! 6 2 = ~有两个前导0位的概率是 log ! 6 4 - 

log 16 2 = |; 其它两种情况与此类似。前导0位的“平均”数是1 所以“有效位”的 

■ 

“平均 ，，数 是户+ ^■。然而最坏情况，即 f -1 位，以较高的概率出现。实际上，通常有 

必要把误差估计建立在最坏情况的基础上，因为一个计算链的强度只相当于它最弱 
的环节的强度。在 4.2. 2小节的误差分析中，在浮点十六进制情况下，舍入的相对误 
差的上限为2 1_ \在二进制情况下，在所有规格化的数中我们可有 P + 1 位有效$ 
(参考习题 4.2. 1-3)，且舍入的相对误差以 2 一 l — p 为界。 广泛的计算经验确认，浮 
点二进制产生出比等价的浮点十六进制还精确得多的结果，即使当二进制数有 P 个 

二进位的精度而不是 f + 1个二进位时亦然。 

表1和表2说明，十六进制算术可以做得稍快一些，因为当右调或向左规格化 

时只需要较少的周期。但这个事实同6 = 2相对于其它进制的实质性的优点相比是 
不足道的（也参见定理 4.2.2 C 和习题4.2.2-13,15，21)，特别是因为只须通过在总 

的处理器开销上有一丁点的增加就可把浮点二进数做成像浮点十六进制那样快。 

7. 例如，假设 ( F (10^ .5” - F (10 km )) = log 5 Vlog 10\ 而且假设 

^ m ( F (10 km -4 k ) - F (10 km )) = log 4 k l log 10、则对所有々， 

^( F (10 km - 5') - F (10 km - 4”） = log 10 j 
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但现在假设 e 是一个小的正数，并且选 S >0 使得对0<1<夂尸“）<0，并选 M >0 
使得对于 x > M ， F (： r)>l - f 。 我们可以取々如此之大，使10 — 15 *<占和 4 々> 
M ; 因此由 F 的单调性得 

Y](F(lO km • 5 k ) - F( 10 kw - 4 。）< 

m 

2 (F( 10 “ • 5 々 ) 一 ( 10 々 u —D • 5 ”) + X)(F( 10 々 （;n + 1) • 4 々 ) 一 F( 10 km - 4 ”)= 
F( 10 ~ k • 5 々 ）+ 1 - F( 10 k - 4 ^) < 2 ^ 

8 •当 s > r 时， JV 10\) 对小的 n 为1，而当 LlO \」> Ll ( Tr 」 时它为0。使得这 

种情况出现的最小的 77 可能是任意大的，所以对于与 S 无关的 No (0 不能给出 一 致 

的界来。（一般地说，微积分课本证明，这样一个一致的界将意味着极限函数 S 0 (5) 
是连续的，但它不是。） 

9.设 <7 i ， g 2, …使得对所有的十… 0 由此得 


出对所有的说和二 1 — : 1 ) +…。 

10•当 l<r<10 时，生成函数 C(z) 在点 1 + w 处有简单的极点，其中 w n = 
27C?? i/ln 10 ， 因此 


CU ) 


logio 厂 - 1 

1 — Z 


十 




ZV 


71 


e 


-In r 


n 


-1 


) 19^0 


IV 


n 


(In 10)(z - 1 - 


ZV 



+ E(z) 


其中 £U) 在整个平面是解析的。于是如果沒 


10)，则 


C 


m 


iogl0 r _ 1 _ 


2 


lnlO 




e 


IV 


In 


n 


- 1 


n >0 


ZV 


,(1 



ZV 



m 



e 


m 


sin( mO + 2tc log^r) - sin( md) 

iOgio ^ _ 1 - - - ■ o ! - - + O 


丌 （1 + 4 丌 2 /(ln 10) 2 ) ml2 


(1 + ^/(ln 10)) 2W2 


当 （log 6 L0 mod 1 一致分布于 [0，1) 时， （log 6 l / U ) mod 1 = 1 - ( log b U ) mod 


1 亦然 


O 




12. 我们有 h(z 


z 


lib 


fix) dxg (z/bx)l bx 



4 / 


A 


f(x)dxg(z/x)lx ，因此 


Z 


h(z) - 1(z 

l(z) 


z 


f(x)dx g(zlbx) ~ Uzlbx K 


Hb 




f(x)d 


X 



z 


l(z/bx) 

zjx) — L(zl x 
l(zl x) 


由于 / (1)>0，对所有2 ：， |(A (2：) - / ( z ))/1 ( Z ) 




Z 


f(x)dxA(g) 


lib 



f(jo)dxA(g) ，因此 A(/i)<A(g) 


由对称性， A(/i)<A (/)。[ 见 Beh Sys tem 
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Tech • J • 49 (1970) ， 1609 ， 1625 


13 •令 X 


( log 6 L 7) mod 1 和 Y 


( iog 6 V ) mod 1，使和 Y 在 [0，1) 中独立地 


一致分布。当且仅当 y > i 时不需要左移，这种情况以+的概率出现 

(类似地，由算法 4.2.1 M 实现的浮点除法的结果不需01_ 

1 — 

要规格化移位的概率是这仅仅需要两个操作数独立地 X . 

有相同分布这一较弱的假定就行了。） \ 





10的计算。如果々 




0 , 


则一个进位的概率是 


lnlO 


dx dy 


10 


i^x y y^l0 x V 


(见图 A -7) 积分的值是 


图 A - 7 


10 




JO 


- 2 


1 iy 


10 


^ 」10 -_y 


X 


y ho-y 


X 


以及 




t 


In 





\ — yj 10 


0 


10 


+ 200 + 30^0 


4 4 


dy 


10 + 400 + 9000 + 


(后一积分实际上是一个“ 



) 因此，当 



0时一个进位的概率是 （1 /ln 


10 ) 


tc 2 / 6 — 22 


n^l 


1 / 


n 


10”） 〜.27154。 


注■.当 



2和 



0时，小数溢出总出 


现； 所以这个推导证明2 

当々>0时，概率是 


7 ? 


lln 2 2 


TT 


/12 


( ln 2) 2 /2 0 ] 


10 


)-k 


10 


In 10 


10 




> 」 10 -》 


dx 


x 


In 10 


S 

n ^1 


n 


2-i r\nk 


10 


s 

>1^1 


n 2 \0 n{k + l) 


于是当 




10 时，小数溢出将以近似概率 .272 如 + .017 h + . 002 户 2 + 


6 = 2时，对应的数字是/> 0 + *655/> 



• 288 ^2 



■ 137夕3 + *067/> 



.033^5 



出现。当 


■016夕6 



• 008p7 + *004 pg + .002pg + .OOlpio 十 … 


现在如果使用来自表 1 的概率除以 .91 以消去零操作数，并假定诸概率与操作 


数符号无关，我们预测当6 


10时，概率大约为14%，而不是习题1中的15% 


对 


于 b 
极限 


2,我们预计大约是48%，而这个表给出44% 

-致。 


这些结果肯定同实验误差的 


15. 若 A =0,则当且仅当有一个进位时前导数字为1。（当 b >4 时，小数溢出 
和随后的舍入会产生一个前导数字2,但在本题中我们不考虑舍入。）如同上题所 
示，小数溢出的概率近似于.272,而 .272< log ]0 2 o 

当 k >0 时，前导数字是1的概率为 
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10 


-k 


dy 


In 10 


10 


y 


dx 

<.2-y x 

或 10 — 


10 


\-k 


< 


In 10 


10 


—k 


y 」 1 (r < 2 


dx 


JO 


logio 2 


16. 为证明提示[这个提示见 Landau,Prace Matpmatyczno-Fizyczne 21 (1910)， 


103 




113] ，首先假定 lim sup a n 




A >0。 设 




A/(A +4 M ) 并选择 N 使得对所有 n 


>N ， 


a 


+ 


+ I < Yq 。设 n > NI (1 — 6 )， 72〉 5/( 使 得〜〉 了 A 。 


则由归纳 


法，対于 0< A<m ， a n - k^ a n ~ kM/ ( n - m)>~X ，且 (⑺ _ 1) 〉 





Am。 但是 

= I - 2 10<rJ — 〜 

因为 n _ m > N 。 如果 lim inf ~ < 0 ，则可推出类似的矛盾。 

假定当 n — 00 时，匕 .i ( 7? ) — A ，命〜=(々）— A 。 如果 m 〉0, 则满足提 
示的假设（参考等式 4.2. 2-(15))，因为 0< P W U )<1 ; 因此 P m ( n ) — X 。 

17. 参见 J . Math . Soc Japan 4 ( 1952)，313 〜 322。（从 Cesaro 的一个定理 [ At- 

ti . della Reale Accademia dei Lincei , Rendicon ti (4) 4 ( 1888 )，452 〜 457 ] 可以推出调 
和概率推广到通常的概率这 一 事实。 Persi Diaconis[Ph, D. thesis Harvard Uaiversi- 

ty，1974] 在其它场合，已经证明在下列精确的意义下，由重复地取平均得到概率的 
定义比之调和概率为弱，即如果 lim m ^oo lim inf„ — ⑺ P m ( n ) ~ lim m ^oo lim sup" 一 oo 

匕 ,（n) = A， 则调和概率是 A 。 另一方面，“对于某个整数 々>0，1( /这 


一命题有调和概率|，而重复地取平均绝不会来给它以任何特别的概率。） 

18. 对于 l<a < b iS ： p ( a ) = P ( L a )R p (a , b ) = S a o<4 ⑷。由于对所有 

的。， 1 ^ = 1 心 1 ] 1 > 心十 1 1 >" 1 ]丄心 + 9 ，由（ 1 )我们有 p(a) = p(l 0 aA 0 (a + 1)) 0 

而且，因为由 （i)，（ii)，（iii)，P(S) = P(2S) + P(2S + 1)，我们有 p ( a ) = p (2 a $ 
2(a + 1))。由此得出，对所有 m y n >0, p ( a y b ) = p (2 m 10 n a y 2 m l 0 v b) o 

如果 则 p{a , b )^ p{a yb ') o 原因是 log 2 / log 10 是无理数， 

因此存在整数7^，772 / ，，使得广'10”^<2-10\<2,0%<2104 / ，因此我们 
可以应用 （v)。 （对于々=1和 U n = nlog 2 / log 10,参考习题 3. 5-22。）特别是， p(a)> 

p(a + l)， 而且由此得出 p ( a y b ) lp ( a,b + 1)^-( b - a ) l(b + 1 - a ) 0 (参考等式 
4.2. 2-(15)。） 

现在我们可以证明每当= V /，时，= 〆〆，//);因为对于任意大 

的 ti , p(a j b ) = p ( 10 ?? a , 10 ;, 6 ) ^ c ri p ( 10 n a , 10”6 - 1) ^ c n p ( a' ， 6') ，其中 = 
10 v ( b - a ) l (10 n ( b - a )- l ) = l + 0(10 — ")。 

对于任何正整数 n ，我们有 p ( a \ b n ) = p ( a n ， ba n -') + p (6/— 1 ， — 2 ) + … 
^ p ( b ?, ~ l a , b n ) = np ( a , b ) 0 如果 l(T<a”<10 m + l 且 10: < V < 1(T' + 1 ，则由 
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+ ， i ( r ' + 1 )。 但由 （ lv )， p ( i ， io ) = 1 ，因 

此，对所有的 p ( 10 m AO m， ) = m ' - m 。 结 论：对 于所有 /2 ， Llog 1() M 」 _ 
Llog 10 a ”」 - Knp ( a ，6)< Llog 10 M 」 + Llogioa ”」+ 1，而且 p(a , b ) = iog 10 (6/ a) o 

[本题受到了 D . I . A . Cohen 的启发，他证明了一个稍弱的结果，见 
J . Combinatorial Theory A20 (1976) ， 367 〜 370。 ] 

19. 等价地，在定义 3.5 B 的意义下 〈（ bg 10 P ；) mod 1〉是等分布的，由于由 

1.2.8-(14)，1呢 10 ^= nl O g 10 < A - l O g 1( ^ + 0( 多一 2 ”），这等价于由习题 3.5-22 得出的 

〈 nlog 1 Q ^〉 的等分布。 [Fi bona ceil Quarterly 5 (1967) ， 137 〜140。」同样的证明表明序 

列 〈 Y 〉， 遵从不是10的幂的所有整数 b > l 的对数定律 [ Yaglom 和 Yagiom , C / ial - 
lenging Problems with Elementary Solutions) (Moscow : 1954; 英译本， 1964 ) ， Problem 

91 b ]。 

注：许多其它的整数序列都有这个性质。例如 ， Persi Diaconis[Annals of Proba - 
bility 5 (1977)，72 〜 81] 证明了， 〈 n !> 是这样的序列，而且在 

lim ^ + 1 公 [10/ < r ] = log 10 r 

的意义下，二项式系数也服从对数定律。 P .Sch^t te[Math. Nach rich ten 148 (1990)， 

137 〜 144] 证明了每当部分商如同在习题 4.5.3-16 中那样有多项式变形的一个重 

复模式时，连分数的近似的分母有对数的小数部分。 一 个有趣的未解决的问题是序 
列〈2!，（2!)!， ((2!)!)!, …〉是否有对数的小数 部分； 参见 J . H . Conway 和 
M . J . T . Guy yEureka 25 (1962) ， 18 〜 19。 

4.3.1 小节 

2. 如果有待加上的第〗个数是 w , = (〜(„ -1) … w , : G ) 6 ，则使用算法 A ， 并把步 
骤 A 2 改动如下。 

A 2'. [加数字]置％ — ( w u 十…十“叫十々） mod 6，且匕（叫十…十 a — + 

k)l b] Q 

( k 的极大值是 m -1， 所以如果772 >6,步骤 A 3 将不得不被改变。） 

3. ENN 1 N 1 

JOV 0 FL 0 1 确保溢出开关断开 

ENTX 0 1^—0 

2 H SLAX 5 N ( rX=k 的下一个值） 

ENT 3 M * N ,1 N ( L 0 C ( w 7 ,)^ U + n(i - l) ^ j) 

3 H ADD U ,3 MN rA ^ rA + u i} 

JN 0 V * + 2 MN 
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工 NCX 

1 

K 

DEC3 

N 

MN 

J3NN 

3B 

MN 

STA 

W + N,1 

N 

INC1 

1 

N 

J1N 

2B 

N 

STX 

W 十 N 

1 


进位1 

对于 m » l 重复 

( rI 3 三 n ( i ~ 1 ) 十 7 ) 
ujj^—rA 

对于 w 重复 
存最后进位于中 


假定尺=+从~，则运行时间是5.5]^十77^ + 4个周期。 

4.在 A 1 之前我们可以做如下的 断言： “72 >1;而且对于 n ，0<~，％< 
6。”在 A 2 之前，我们 断言： “0< j < 72;对于0<2<；2,0<屮，％<6 ; 对于 

0^ Wy < b ;而且（力-广‘“^办十（以厂广.幻 0 ) 6 = ( 是叫—丄…如。）々。，’更确切地 

说，后一命题意味着 


X ) u fi l 十 X ) v fi l = ^ + 2 w fi l 

0<1<J 0</<i 0</<j 

在 A3 之前，我们 断言： “0<；< n; 对于 0<2'< 72,0<z/,:， ％< 6; 对于 

叫<6;0<是<1;且 （ yw 0 ) 6 十（％… t ; 0 ) 6 =(々％… w „) 60 ” 在步骤 A 3 之后，我们 

断言，对于0<2‘ < n ，( Xzv t < b ;且 （- i … w 0 ) 6 + (\- r"ro) 6 = (加刀… 

加0)6。 

只要验证这些断言之间必要的蕴涵关系和证明这个算法总是有穷的，则完成此 
证明就只是简单的事情了。 

5 . B 1 • J j^~n — 1 , uu n 一 0 0 

B2 •置 t — Uj 十 Vj ， w 广 t mod b , i — j 。 

B 3 . 如果 i 6 ，则置 i^~i + l ^ t^—vui + 1 y zvi ^~ t mod 6,并重复这一步骤直 
到 t < b 。 

B4.j 减1，而且如果则返回 B2。 | 

6. C1 . 置 j — n ~ 1 y n , r —0 。 

C2 •置 t — Uj 十 Vj 。 如果 Z > 6 ，则置叫 —r 十 1 ，而且对于 i > k > j ， zv k —0 •， 

然后置 f —; 和 r^~t mod 6。否则如果 t < b ~ 1 ，则置 w { ^ r ，而且对于 
i > k>j } iv k ^b ~ 1; 然后置 f ; ■和 r — t 。 

C3. J /减1。如果 jSO, 则返回 C 2; 否则叫 — r， 而且对于 i > k >0 y w k ^~ 

b ~ 1 0 I 

7. 例如当 j=77 -3 时，々=0的概率为 （6 十 1)/26; 是 =1 的概率为 （（6 -1)/2M • 

• 593 - 


习题答案 


(1 - 1M) ，这即是出现一个进位和前一个数字不是 b - 1 的 概率； 々=2的概率是 （（6 
- l )/2 b )( llb)(l - 1/6); 而且 k 二 3 的概率是 （o - 1)/26) (1/6 )(1/6 )(1)。对于固 

定的々，我们可以随 j 从 n - 1 变到0而把几个概率加在 一起； 这给出进位向后传播 
k 个位置的平均次数 


饥 k 


b - 1 
2b k 



77十1 




k ){ 1 






b 


作为检验，我们求得进位的平均次数是 



同 （6) — 致。 



ENT1 N-l 1 

JOV OFLO 1 

STZ W + N 1 

2H LDA U,1 N 

ADD V，1 N 

STA W,1 N 

JNOV 4F N 

ENT2 1 ， 1 L 


3H LDA W,2 K 

INCA 1 K 

STA W,2 K 

INC2 1 K 

JOV 3B K 

4H DEC1 1 N 

JINN 2B N 



运行时间依赖于 L , 即使得义 + V ] > b 的位 置数; 并依赖于 K ， 进位的总数。不难看 
到， K 与出现在程序 A 中的那个量是同一个量。正文的分析表明， L 有平均值 

N ((6 -1)/26) ，而且 _ K 有平均值士 ( A 「- - h - 1 - b ~ n ) o 所以如果我们忽 

略阶为 1 M 的项，则运行时间是 97 V + L + 7 K + 3 〜 13 N + 3 个周期。 

9. 在步骤 A 2 中处处都以代替“6”。 

10. 如果行06和07交换，则我们将几乎总有溢出，但在08处寄存器 A 可能有 
一负值，所以这样做行不通。如果交换行05和06上的指令，则出现于此程序的溢 
出序列在某些情况下将稍有不同，但这程序仍然是对的。 

11. 这等价于串的字典序比较 ：（ i ) 置 j — n - l ;( ii ) 如果士 < %，则结束 [ w < 

幻；如果〜=%，且 > ；=0，则结束[“ =1；] ; 如果 Uj = %，且 并重 
复 （ ii ); 如果，则结束 [ w > u ]。 这个算法倾向于十分快，因为在我们遇到 U] ^ 
Vj 的情况之前， j 将减少很多的概率通常是很低的。 

12. 以 w ; =0 和 v ] 二， 使用算法 S 。 在这个算法末尾将出现另一个“ 借位，，，对 
此应不予考虑。 

13. ENN 1 N 1 ADD CARRY N 

JOV OFLO 1 JNOV *+ 2 N 
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ENTX 

0 

i 

工 NCX 

1 

K 

2H STX 

CARRY 

N 

STA 

W + N,1 

N 

LDA 

U + N,1 

N 

工 NCI 

i 

N 

MUL 

V 

N 

JIN 

2B 

N 

SLC 

5 

N 

STX 

W + N 

1 


运行时间是 23N + K + 5 个周期，而且 K 大略等于 + iV。 

14. 关键的归纳论断在步骤 M4 开始时就应该 成立； 所有其它的论断都不难由 
此推出，它 们是： “0<2<772 ; 0<_；<72 ; 对于 0</<m，0<〜<6; 对于0</<72,0< 

巧 < 6 ;对于(X /〈』+ m，(X w L 〈 b < b ; 而且在习题 4 答案的记号下 

+ kb l+J = u X (v J _ 1 --v 0 ) b + ( 屮 ― 「 .w 0 ) 6 X vp 1 

15. 误差非负而且小于 U -2)6_^ 、[类似地，如果我们不考虑对于 1+ j > 

3的诸乘积，则误差将以 U -3)6 为界， 等等； 但是，在某些情况下，如果我 

们想要得到真正的舍入结果，则就必须计算所有的乘积。进一步的分析表明，通过 
只做计算全双字长乘积所需要的大约一半的工作，几乎就总可以得到多精度浮点小 
数的正确舍入的 结果； 而且，一个简单的检验将找出需要完全精度的稀有情况。参 

见 W.Krandick 和 J . R. Johnson y Proc . IEEE Symp . Computer Arithmetic 11 (1993) ， 

228 - 233 o ] 

16 . SI •置 r —0 ， j — n — 1; 

S2 •置 + Uj) I v 入 ， r—(rb + ) mod 幻。 

S3.j 减1，而且如果则返回 S 2。 ■ 

ii . uhyu ^ Kv ^-^ Db 71 - 1 = b ( i - iKv Tl - l ^ i ))> b ( i - i ( bl 2)) = b -2 0 

18. ( u n b + u n - Y )l (v n - l + l)^ ： u(v n - { + 1) b n _' 〈 u I v 。 

19. u ~ qv^n - qv n — ib )il - Qv n 一 2 b n — 2 = — 2 Y _2 + _. •十 w 0 + 冲 ” — 1 一和 „ — 2 . 

b n ~ 2 <i b n ~ 2 (u n - 2 1 + rb - qv n _ 2 )^0 o 因为 u _ , q 〈 q 。 

20. 如果 _ 2,则 w < ( (J - 1) v <i q ( v n -i b n ~ 1 + ( v n -2 ^ 1) b n ~ 2 ) - v <i 

Qv n - l b n 1 + qv n ~ 2^ n 2 + b n 1 — Qv n - Y b n 1 + {bf + u n - 2 ) b n ~ 2 + b n 1 — v — 

u n b n + u n -ib }1 ~ 1 + u n - 2 b n ~ 2 + b n ~ { - u n b n + u n - { b n ~ l + '一 2 心 ” 一 2 < w 。换言 

之， w < w ，此为矛盾。 

21. ( 由 G.K.Goyal 给出的解）不等式 Qv n - 2 <bf +〜_ 2 意味着我们有§ < 

( u n b 2 + u n - x b + u n - 1 )\{ v n - l b + v n - 1 )^ u \{{ v n - l b + % 一 2 )心 77 — 2 ) 。 现在 w mod v 
= w — gt; = T；(l - Q：)， 其中 0<a = l 十 g — ul v^：Q - ul v^u (ll (( v 1} - i b + v n - 2 ) m 

心 『2) _ i / 幻） = 以 （％ _ 3 y _3 + … % % — 2)6” — 2 t0 < W( % - i - i • 6 ) 

<(6-1)/(% — 0)， 而这至多是2/6,因为 ^^>+(6-1)。 
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题答案 


22•设 w 二 4100， z ； = 588,我们首先试一试3 = Lf 」= 8, 但8-8> 10(41 - 40) + 

0。然后置$=7,现在发现7*8<10(41-35)+0。但7乘588等于4116,所以真正 

的商是^ = 6。（顺便指出，此例表明，在给定的假设下，当6 = 10时，定理 B 已不能再 
作改进。） 

23. 显然， z ； L 6 /U + 1)」<( z ； + 1) L 6/( t ; 十1)」<6;而且如果则下限肯 

定成立，否则 v\_b/(v + 1) b - v)/(v + l)^(b — 1)/2 ^>\_b/2] ~ 1 Q 

24. 近似的概率仅是 log 6 2, 不是士。（例如，如果6 = 2 32 ，贝1] puM 31 的概率 


近似于;这对于保证步骤 D 1 和 D 8 中对 d = 


25. 002 

ENTA 

1 


i 

003 

ADD 

V + N - 

i 

i 

004 

STA 

TEMP 


i 

005 

ENTA 

1 


i 

006 

JOV 

IF 


i 

007 

ENTX 

0 


i 

008 

DIV 

V + N - 

i 

i 

009 

JOV 

DIVBYZERO 

i 

010 1 H 

STA 

D 


i 


1的特殊测试说来，仍然是足够高 

如果 whU 则转移 

否则计算 b/U + i )」 

如果=0则转移 


Oil 

DECA 

i 

012 

JMZ 

*+ 3 

013 

STZ 

U + M + N 

014 

JMP 

D 2 

015 

ENN 1 

N 

016 

ENTX 

0 

017 2 H 

STX 

CARRY 


1 

1 如果 d 尹1 则转移 

1- A 置 u m + 0 

1 - A 

A r 乘以 d 

A 

AN 


018 LDA 

019 MUL 


026 JIN 

027 EMI 

028 2 H STX 


029 


V + N ,1 AN 

D AN 

(如同在习题 13 中那样) 

2 B AN 

M + N A (现在 rX = 0) 

CARRY A(M + N ) w 乘以 d 

U + M + N,l A(M + N ) 
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LDA 


4.3.1 小节 


… （如同在习题13中那样) 

037 JIN 2B A(M + N ) 

038 STX U + M + N A I 


26.( 见习题16的算法。) 


101 

D8 

LDA 

D 

1 

102 


DECA 

1 

1 

103 


JAZ 

DONE 

1 

104 


ENT1 

N- 1 

A 

105 


ENTA 

0 

A 

106 

1H 

LDX 

U，1 

AN 

107 


DIV 

D 

AN 

108 


STA 

u,i 

AN 

109 


SLAX 

5 

AN 

110 


DEC2 

1 

AN 

111 


J2NN 

IB 

AN 


(余数将留在 U 到 U + N - 1诸单元中) 
如果 d = l 则终止 

rll=j \ - 1 

r — 0 

rAX^~r6 + uj 

(^, r )^-( LrAX /^ J,rAX mod d ) 



对于 n > j >0 重复 


这时，除法程序已经 完成； 而且由下一题 ， rAX = 0 D 

27 . 它是 du mod dv = d ( u modi ;) 0 

28. 为方便起见，我们假设 n 有一小数点在左边，即 v = ( v n . v n - I v n - 2 ,,f ) b 
在步骤 N 1 后我们有 l /2< t ；< 1 + 1/6: 因为 

b + \ ^ v(b + 1) _ v(\ + llb) . 1 J_ 

v n -\ 十 1」 \ v n - l + 1 (llb)(v n . l + 1) b 

而且 


V 



v(b + 1 - ^_i) 

化 -i + 1 





幻 n - l(b + 1 - 




1 



V 




当 1^4 = 1 时，后一个量取它的最小值，因为它是一个凹函数，而且另一个极值要大 


——此 

o 

步骤 N 2 中的公式可重写成，所以如同我们上边看到的，绝 

^-1 + 1 o 

不会变成大于等于 1 + 1 M 。 

在步骤 N 2 迭代一次之后，如果 + 的极小值大于等于 



b(b + 1) - v n -i 

%-1 + 1 



(b(b + \) - v n ^ x \ v n - Y 
V ^n-l + 1 / b 1 


(b(b + 1) + 1 - M / 卜 U 





b(b + 1) + 1 

t 
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习题答案 


当 z = 6/2+ l 时出现这个量的极 小值； 下限为1-3/26。因此在步骤 N 2 迭代一次 
之后最后，当6^5时，我们有 （ 1 _ 3l2b )(1 + 1/6) 2 〉1，所以至多需 

要增加两次迭代。当6<5时，这个断言是容易验证的。 

29 . 真的，因为 （ + „ …％ ) 6 < 。 

30. 在算法 A 和 S 中，如果这些算法略微改写一下，则这样的重叠是可 能的； 例 
如，在算法 A 中，我们可以这样来改写步骤 A 2 : “ 置 t^Uj + Vj + k ， w 广 t mod b , 

々一 L " 心」 。” 

在算法 M 中，％和％ + „可以在相同的单元中。在算法 D 中（如同在习题26的 
程序 D 中那样），最方便的是命…〜和 —样； 而且假设在步骤 D 6 中 
不改变％ 的值，则我们也可以有…^。和 u m + u n 一样。（程序 D 的行098 
可安全地改变为 “JIN 2 B ” ，因为％ + „在后面的计算中不使用。） 

31. 如同在算法 D 中那样，对于 w = ( w ; + w … w ; + 1 七） 3 考虑图6的情况。如果 

w 和 t ; 的前导非零数字有相同的符号，则置 r — u _ — 1;否则置 r^u + v ， q — 

- 1。现在如果 | r |>| w |， 或如果 | r | = | w | 且的头一个非零数字有和 r 

的头一个非零数字同样的符号，则置 g —0; 否则置％ + 为〃的诸数字。 

32 .参见 M . Nadler , CACM 4 ( 1961 ) ，192〜193 ; Z _ Pawlak 和 A . Wakulicz , 
Bull , del ' Acad . Polonaise des Sciences , Class III ， 5 (1957 )，233 〜 236 ( 也参见 803 〜 
804); 以及习题 4.1-15 。 

34 . 例如，参见 R _ E • Maeder , The Mathematica Journal 6,2 (1996 年春 ） ， 32 〜 

40;6,3 (1996 年夏 ），37 〜43。 

36. 以±2一 2 ”的精度给定今，我们可以通过减法逐次计算 ^ T 1 ， 今一 2 ,…直到今〃 
<2 — ”；累计误差将不超过2 1 — %然后我们使用级数 In ^= ln((l + r 3 )/( l -^ 3 )) 

= 2( 令 — 3 + ^ -9 + + 今 — 15 十…）。[参见由 C . G . Knott 编的 TVapier Tercentenary 

Memorial ( London : Longmans ， 1915 ) 中 William Schooling 的文章， 337 〜344。 ] 1965 
年由 J . W . Wrench , Jr . 提出的一个更好的过程，是计算 

In 今= yln((l + 5- " 2 )/(1 - 5- 1/2 )) = (2 令- 1)(5- 1 + j 5~ 2 + y 5~ 3 + •**) 

37. 令 d=2 e 使得代替在步骤 D 1 来对 w 和 t ; 进行规格化， 

我们通过左移 e 个二进位来计算2^(^_ 1 ^_ 2% __ 3 ),的两个前导数字 t //。 在步 

骤 D 3 中，使用 （ t / ， ！；〃） 来代替 （- 1 ， - 2 ) 和使用 \ u\ z /〃） 来代替 （ 乂 + „， 

屮十„ -][ ，屮 + „ — 2) ，其中数字 U ' U " U ’" 是 由…％ + „ - 3 ) 6 通过左移6个二进位得到 

的。在步骤 D 8 中省略除以 d 的除法。（实质上， W 和被“虚拟地”移位。当相对 
于 n ， m 很小时，这个方法节省计算。） 

38. 置 A — 72，，—0，^ — l ， z — 0，！^ — 我们将保持不变量关系 uv — 2 2k ( r + 

5 2 — 5 ) + 2 2k ~ n t + 2 2k 连同 （X t ， vo 〈2” 以及连同 0< ，除非 （ r ， s ) = 

(0,1) o 当々〉 0 时，设 = 2 n zv / + 加’和 + w'v — 2 n t / + ，其中 if " ， t 〃 <2 n 
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4.3.1 小节 


和<6;然后置 z —r ， -w^-zv^ , s^~2s , r —4 r + t' ~ s ,k^k - 1 0 如果 ， 则 
置 5 —5-1 和 r — r +25; 否则如果厂 >25,则置 r — 厂25,以及 5 —6- + 1( 这个校正 

可能要做两 次）。 重复直到々=0。然后 “ t ； = r + 5 2 - 6、，因为 w 总是2 2 ” — 2* 的倍数。 
因此厂二0当且 仅当⑽ = 0;否则答案是因为 ㈣ _ + 5。 


39•令 5 = 2] o 0 16 — V (8 A 十乃 。 我们要知道是否 Y —^ modlC ^ 由于 tt = 
45 1 -25 4 -5 5 -5 6 ，因此只须有对2” — 1 &111(^1的好的估计就足够了。现在2^ _1 

S J 和 S 0 < K ”/ 4a _/( 8 々 + j ) + Tj k ^ v i 4 2 n ~ l ~ 4 k l (8 k +_;) 同余 （modulo 1) ，其 中 = 

2 ,2 " 1_4 ^00[ (8々+ j )。 头一个和中的每一项可以通过在 0 ( i og 幻个运算之内计算 
“_而近似到 21 的范围内 （4.6.3 小节），而后求出调整了的商 L 2 W (8々 + ; )」。 

第二个和可以通过计算 2 W 乘以它 的头奶 /4项而被近似到 2 — w 之内。如果 m ^21 g 
"，则不确定的范围将是〜 1/ n ， 而且这几乎总是足够精确的。 [ Ma 也 Comp. 66 

(1997),903 〜913。] 



8, _ S 胛 12 = |(/ 0 +「％ + …+「 7 々 7 )。因此4义 - 2 S 4 - S 5 - S 6 = 2/ 0 — (2 - 

2 i )2々 + 2 / 4 + (2 + 2 i ) Z 7 = 7r 。 其它有 趣的恒 等式是 





V 2 arctan ( l / 拉)二 S ' - yS 3 + 





arctan(1/3)= Si ~ S2 - i S4 - i 




一 般说来，我们有 


0= 8 Si — 8 S 2 - 4 S 3 - 8 S 4 - 2 S 5 




S 

k>Q 


s 

k>0 


Z 


8 々 + l 


Sk + 1 


z 


8 々 + 3 


8 ^ + 3 


= A + B + C + D, 

= A- B — C + D ， 


S 

々彡0 


E 


z 


8 々 +5 


8 ^ + 5 


z 


8A+7 


8 々 + 7 


A ~ B + C - D 
A + B - C - D 


其中 
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习题答案 



C 


4 


arctan ^: ， 


D 


2 


5/2 


arctan 


72 


% 


1 — z 


而且 



z 


mk 七 a 


走 >0 


mk 



a 


m 


( ln ( 1 — z 



— l) a [m 偶] ln(l 



z 





L ( 


1)/2」 


fa 


m 


Z 



k 


2izka' 
cos - In 

m 


- 2 


2izk 


zcos 



z 


m 


^ . 2nka 2 ： sin( 2 ir ^/m ) 

Zsin - -arctan 


\ 


m 


1 - zcos(2nkl m ) j 


40. 为了获得最高有效的 n /2 个单元，我们需要大约基本运算（参 

见习题15)。而且当6是2的幂时，通过使用 ^- adic 的方法我们可以得到最低有效 
的 n /2 个单元(参见习题 4.1-31): 问题可以很容易地归结到 u 是奇数的情况。令 W 

二 （ … W 2 W = ( …叫） 6 以及= ( … W 2 加1加。）6，其中我们要来解 W = 

modulo b nl2 ) 0 计算 t / 使得 t/r mod 6 = 1( 参见习题 4.5.2-17)。 于是 w 0 = 
v'uq mod b ，而且我们可以计算 u = u ~ uoqV ,vo x - v mod b ， 等等。 在进行了大 


约 n 2 个基本运算之后，找到最右的个单兀。所以总共为+ + 0 ( n ) ，而算 


法 D 需要大约72 2 + O ( n ) o 对于所有 n 个数字一个纯粹从右至左的方法将需要 | 

w 2 +0( n )。 [参见 T . Jebelean , J. Symbolic Comp. 15 ( 1993 )，169〜180; 
A.Schonhage 和 E. Vetter , Lecture Notes in Comp. Sci. 855 (1994) ,448 〜459。 ] 

41. a ) 如果 m =0, 令 t ; = w ， 否则从 （〜 + „_；! 减去: cw ，其中 ：c = 

Wo u/mod 心这使 1 的数字变0。所以我们已经有效地把 m 减小1。（这个运算同 


在6 - adic 算术中的 uj w 的计算紧密相关，因为对于某个整数 q , ul ZV = q + b m v\ 
参见习题 4.1-31。 它胜过通常的除法，因为我们绝不需要校正一个试验因子。） 
b ) 把 a ) 应用于乘积上。如果我们把乘法和取模交错在一起如下，则可以保 


留存储空间。置々 


0, 


0。然后在 k < n 时，通过置 


t + u k v ， t — {t - 


XXV 


)1 b , 


々—々 + 1， 保持不变关系 b k t = (u k - u 0 ) v (modulo if ) ， 其中 ：c = Z 0 Tx/mod 6 被选 

择成使是 6 的倍数。这个解假定和 t ； 有一个带符号的数量 表示； 如同 

由 Shand 和 Vuillemin 及由 Kornerup 所讨论的那样 [JEEE Symp. Computer Arith- 

metic 11 (1993)，252〜259,277~283]，我们也可对小于2切的非负数或对于补码记 
号进行工作。如果 n 很大，则 4.3.3 小节的技术可加快乘法。 

c ) 通过一个内部值 r ( w ) 来表示同余于 u (modulo w ) 的所有数。然后加法和 
减法像通常那样处理，而乘法是 r{uv) = bmult ( r ( M )， r ( r ))， 其中 bmult 是 b ) 的运 
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4.3.2 小节 


算。在计算开始时，使用预先计算的常数 a = f〃mod w ， 以 r(u) = bmuh(u y a)iX 
替每 一 操作数 w 0 在结束时，以 w = bmult ( r ( w ) ， 1 ) 代替每 一 个 r ( w )。 [在应用于 

4.5.4 小节的 RSA 密码中时，我们可以重新定义编码方案使得预先的计算和事后的 
计算都无必要。] 

42•由 J . M.Holte &4 MM 104 (1997) ，138〜149上给出的一个有趣分析确立 
了精确的公式 


。，仝 

r = 0 

当 J=0 时，内部的求和是 s 九。（― l) r ( m + （习题 5.1.3 — 




25说明为什么在这个联系中会出现欧拉数。) 


43. 由习题 1.2.4-35 我们有 w = LW /2 16 」， 其中 W 二 （2 8 + 1 ) z = (2 8 + 1 )( ㈣ + 

2 7 )。 因此如果 a /255 >c + 士，我们有 c <2 8 , 因此 ^> L (2 16 (c + 1)+2 8 - c )/2 16 . 


+ 1;如果 xyl 255 <c + 1/2,我们有 u ;< L (2 16 (c + 1) - c - 1)/2 16 」= c 。 [参见 

J • F . Blinn ,7 EEE Computer Graphics and Applic . 14,6 (1994 年 11 月 ），78〜82。] 


4.3.2 小节 

1. 解是惟一的，因为7 *11 *13 = 1001。定理 C 的构造性证明告诉我们，答案是 
((11-13) 6 + 6*(7-13) 10 + 5-(7- ll) 12 )mod 1001。但这个答案也许不够明显！.由 

(24)，我们有 t ； 1 = l , t；2 = (6 — 1)*8 mod — ((5 — 1)*2 — 7)*6 mod 13 = 6, 

所以 w =6-7.11 + 7.7 + l 二512。 

2•否。至多有一个这样的附加条件&三 …三心 （modulo 1) 是必要和充分 

的，而且由此知道这样一种推广不是非常有趣的。 

3 • we 〜 （modulo m ,) 意味着 w = (modulo gcd ( m { , )) ，所以如果有一个解 

的话，条件= modulo gcd ( m { , m ;)) 必须确实成立。而且，如果对所有 j ■有 w 三 

v (modulo m )) ,则 w - w 是 1 cm ( ，…， m r ) 二 m 的倍数；因此至多有一个解。 

现在通过计算满足条件 w ) < 且％三义 ( modulo gcd ( m 2 . ， )) 的不同 r 

元组“ i ，… ，〜） 的个数，可以用一种非构造方式来完成这一证明。如果这个数是 
m ，则必有一^解，因为当 w 由 a 变成 a + 77 z _ l 时 ， （wmod 7 ^，…， u mod ) 取 m 个 

不同的值。假定已选定^，…，、- 2 满足给定的条件，我们现在必须对于 l < j<r 
挑选 u r = Uj ( modulo gcd ( ， m r )) ，而且由 r - 1个元素的推广的中国剩余定理，有 

m r l \ cm ( gcd ( m { ， m r ) ，… ， gcd ( m r _ x ， m r ) ) = m r / gcd ( lcm ( , m r . x ) , m r ) = 

lcm ( mi , …， 7?7 r )/ lcm ( m r _ x ) 

种方式来做这件事。[这个证明是以 4.5.2 小节的恒等式（10)，（11)， （12) 和 （14) 为 

基础的。] 
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推广 （25) 的一-个构造性证明 [ A . S . Fraenkel ， 尸 roc , Amer . Math , Soc . 14 (1963)， 
790 〜 791 ] 如下 ：设碼 = 1 cm ( m ! ，…， ) ; 我们希望求 w 二 v r M. r _ j + ■ * * + V2M1 + 

h ， 其中 ( XvjKMjIMh 。 假定 h ， …，％_^已经确定，则我们必须解同余式 


VjWlj-i + Vj — iA4j—2 + …+ 以丄三 

根据假设，对于 j ，这里％ — iMj — 2 +…+ v l = 

C = Uj - ( 以厂 ]Mj 一 2 +…+以 1 ) 是 

\cm(gcd(mi 9 m } ) ， … ， gcd( m J . 1 ,m } )) 

的倍数。因此我们必须解 VjMj - { = c (modulo rrij 
使得 CjMj — i = dj ( modulo ); 因此我们可以取 


三 uj (modulo rrij ) 

u { = Uj (modulo gcd ( m { ， m ; )) ，所以 


= gcd ( M ; _! 



); 由欧几里得算法知有一个数 q ， 


V 


c ： c)l d ； mod ( mj d ：) 


注意，如同在非构造性证明中那样，我们有 m 1 ld 1 


MJM 



4.( 在 m 4 = 91 = 7*13 之后，我们已经用完了所有小于100的两个或多个奇素 


数的乘积，所以 m 5 ，…都必须是素数。) 


mj = 

79, 

m 8 

= 73， 

mg = 

71, m l0 = 

67， 
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m 12 = 

59, 

m 13 

= 53, 

m 14 

= 47， m ls 

= 43 , 

讲 16 

= 41 

7? Z 17 二 

37, 

肌18 

二31， 

m 19 

= 29， m 2 o 

= 23, 

讲 21 

=17 

到这里就做不下去了 （ 

m 22 = 

1不好） 

0 






5.否。如果我们选择等等，则明显的上界 


3 4 5 2 7 2 11 ] •- = JX / lo V 00 」 

户奇 
/>索 

就达到了。（然而，当 r 固定时，要极大化 mr * 772,;或者当使用模乃 -1 时，要极大 

化满足~互素的 h + …+ ~，那就更为困难了。）以256取代100并允许偶数模将得 
出2 8 3 5 5 3 … 251 1 〜 1.67.10 109 。 

6. a ) 如果 e = /+ kg , W \ 2 e = 2 f (2 g ) k =2 f - ^(modulo 2^ - 1) 0 所以如果 

(modulo 2 g _ 1) ，则我们有 Z m ° d ^=2 /mod ^( modulo Y - l ); 而且由于后边的量处于 
0和 - 1之间，我们必有 e mod g — f mod 貧。 b ) 由 a)，（l + 2^ + … + 2 ( c — 以）* 

( 2 e - 1) 三 (1 + P + … + 2 (c ~ ])d )- ( 2 d - 1) = 2 cd - l = 2 ce - l = 2 l - 1 = 1 ( modulo 2 f 
_ 1)0 

7. 由 （23) ， （25) 和 （26) 我们有 i … /^三 mi + … + ) 

和 C ^ m 厂 ！… 三1( modulo ); 参见 P . A . Pritchard，CACM 27 (1984)， 57。 

重写这些公式的这个方法使用同样数量的算术运算和较少的 常数； 但是仅当我 
们把模数排序成 … < m . r 时常数的个数才是较少的，否则我们将需要％ 

mod m ] 的一个表。模数的这一顺序看来可能比我们使 mi 最大，而使次大等 

等，要求更多的计算，因为比起模 mi 来，模77^有多得多的运算 要做； 但由 于巧可 

以和77^ - 1 —样大，在 （24) 中对于7?^ < / n 2 < … < 7?2 ; •我们也会好些。所以尽管 
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4.3.2 小节 

4 .3.3 B 小节表明当这些模数有 （14) 的形式时正文中的公式是有利的，但是这一思 
想看来比正文中的公式是更可取的。 

8•模 - m l (-^ ((iij - v Y ) c {j - v 2 ) c 2j - - Vj - i ) X 

c ( 厂 l); 三 2 … 说 i( …(〜— 4)(：；^ —…- Vj— 2 )c ( 厂 2)J _ v 厂 ^1^2 … 饥 \ 三 … 三 Uj 


V 


V2 r)i 


p 广 i m , — 2 … m 



• u 


<i — 


((•••( 


v r m r - 2 



v r ^ { ) m r ^ 2 + 


■ ■ 


m 



Vi ) mod m 


U2 —( v 2 + Vi )mod m 2 , u [^~Vi mod w [0 

(如果我们要让^和％共享同一存储单元，如同在 （24) 中那样，则计算应按这个顺 
序进 行。） 

10 . 如果我们重新定义 “ mod ” 运算符，使得它产生在对称范围中的余数，则关于 
算术运算的基本公式（2)， （3) 和 （4) 以及关于转换的公式（24)， （25) 保持不变，而 

(25) 中的数 w 处于所希望的范围 （10) 中。（这里 （25) 是一个平 衡的混合进制 记法, 
推广了“平衡的三进制”记法。）这两个数的比较，仍以正文中所述的简单方式从左 
到右进行。而且，如果我们在计算机内有带符号的量的表示，即使？7^几乎是字大小 

的两倍，仍有可能以一个计算机字来保留 值力。 但是类似于 （11) 和 （12) 的算术运算 

是更困难的，所以，看起来，在大多数计算机上，按这个思想运算时速度会慢一些。 

11. 乘以士 （m + 1) = (士（肌 i + 1)， …，金' ( m r + l ))。 注意，2/ • m ^ 1 = 

八 modulo 桃）。 一 般说来，如果 w 与 m 互素，则我们（通过欧几里得算法）可以找到一 
个数 v y = ( v [ )使得 ^' = 1( modulo m ); 然后如果已知 w 是 z ； 的倍数。则我 

们有 = 其中后者是通过模的乘法计算的。当不与 w 互素时，除法要困 

难得多。 

12 . 在 （11) 中以772代替[如果 m 是奇数，贝! J 检验溢出的另一个方法是保 
持额外的二进位 u 0 = u mod 2和 v 0 = V mod 2。那么溢出出现当且仅当 u 0 + v 0 ^ 

加】十…十叫 （modulo 2) ，其中（叫，…， uv ) 是对应于 u + v 的混合进制的数字。] 

13 ‘ a ) 对于 p = 2 和 5,: c 2- ：r = ( x _ l )x = 0( modulo 1 CT ) 等价于（: c - 1 ) x ^0 
(modulo p ”。 工 或者： r - 1 必须是的倍数，而另一个同 〆 互素； 所以： c 或者 x - 
1 必为纩的倍数。如果 z mod 2 ?, = ^ mod 5” = 0 或1 ， 则我们必然有工 mod 10” = 
0 或1 ;因此自守有: r mod 2 n ^x mod 5”。 b ) 如果: c = g〆 十厂，其中 r = 0 或1，则 r 

=厂 2 =厂 3 ，所以 3: r 2 _ 2 x 3 ^(6 qp rl r + 3厂）— (6 qp tl r + 2 r ) = r (modulo p 2n ) 0 c ) 设 〆 

是 (3( c : r ) 2 -2( c : r ) 3 )/: r 2 = 3 c 2 -2 c 3 : r 。 

注 ：由于一个〃 位数字的自守的最后々位数字形成一个々位数字的自守，所以 
就可以谈论两个 oo 位数^和 1-1 的自守，它们是 10- adic 数（参考4.1-31)。在模 

算术的情况下， 10- adic 数的集合等价于有序偶 （ Wl ， W2 ) 的集合，其中〜是 2 -adic 
数， W2 是 5 -adic 数。 
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14 .求浮点近似 （ aw 。 ， a : w ，…， y — q 巧 ，…，〜- i - !) 的循 

环卷积 Uo ， q ， …， 'h) ，其中常数〜 = 2_ ( 〜 mod ” )/r3 已经预先计算出来。恒等式 

" = !]::(； ¥7 〆 +和 t = !：::(；¥ 〆 —现在意味着加=，其中 t k ^ 

zJa ko 如果已经维持了充分的精度，则每个^将非常接近于一个整数。从这些整 
数可以 容易地 找到加的表示。 [ R.Crandall 和 B.Fagin ， Mat / i . Comp . 62 (1994),305 
〜324。] 


4.3.3 小节 

1. 12 X 23： 

02 

02 

-01 

06 

06 

0276 


34 X 41： 

22 X 18： 

1234 X 2341： 

12 

02 

0276 

12 

02 

0276 

+ 03 

+ 00 

-0396 

04 

16 

1394 

04 

16 

1394 

1394 

0396 

2888794 


2. VQH 7^ J < VQ +7^ <V Q + 2 /Q + 1 = /Q + 1，所以 L 7 Q + 只」 < 

L^Q J + lo 

3 . 当 k 《2 时，结果为真，所以假设6 >2。设 w 二 2 Q Sq =2~ ，使得 R k = 

LM 」 和 Q 广 + 我们必须证明 1+(^+ 1)2 & 这个不等式一 

点也不相靠近。一条路子是观察当 A >2时，1 + (只々+ 1)2 义<1 + 2 2 义和 2 R k < 

Q,- 1o (2 私的事实容易用归纳法说明，因为私 + 1 -^<1，而且 a - Q k - { 
> 2 0 ) 

4. 对于户1，".，厂，计算 L 7 山 2 )，』1；山 2 )， KG 2 )，； KG 2 ); 而且通过递归地 
调用乘法算法，计算 

W ( j ) = ( U e ( j 2 ) ^ jU 0 ( j 2 ))( V e ( j 2 ) ^ jV 0 (j 2 )) 

W (~ j ) = ( U e ( j 2 ) ~ jU 0 ( j 2 ))( V e ( j 2 ) ~jV 0 (j 2 )) 

然后我们有 W e ( j 2 ) = j ( W ( j )+ W (- j )), W 0 ( j 2 ) = j ( W ( j ) - W (^ j)) Q 再计 

算 W e ( 0 )= L 7(0) V (0) o 现在构造％和 I 的差值表， W 。 和分别是次数为 r 
和 r - 1的多项式。 

这个方法减少了所处理的数的大小，也减少了加法和乘法的次数。它惟一的缺 
点是程序较长（因为控制略微复杂些，而且有些计算必须以带符号的数来进行）。 

另一个可能性也许是在1 2 ,2 2 ,4 2 ，〜，（21 2 处 计算％ 和 W 。； 尽管涉及的这些 
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数更大，但计算却更快，因为所有的乘法皆代之以位移，而所有除法都通过形如 W 
(2& -1) 的二进数进行（对于以这样的数做除法，有简单的过程可利用）。 

5. 以足够大的价和开始 g 和 r 序列，使得习题3中的不等式成立。然后我们 

将在类似于前边定理 B 的一些公式中发现有％ —0和 ^2 = (1 + H (2 r k )) - 

。当 々— ⑺ 时因子 — i ，所以如果要证明对所有 

身 

很大的 I 72 < 1 - ^我们可以忽略它。现在 y 2 Q , + 1 = V 2 Q ^+2 r /2 Q,l + 2 > 

7(20,+2/20； + 1)+ > y 2 Q , +1 + ll (3 R k )。 因此 仍<(1 + 1/(2 q ))2 — 1/(3 V ， 且 
对于充分大的 k y \ grj 2 <0 o 

注：也 可以修改算法 T ， 以定义一个类似类型的序列 … ，它以 n 为基础， 
使得在步骤 T , 之后， n 〜 w + w + t 。 这个修改导致了估计(21)。 


6-6^ + d l 和 6 g + d 2 的任何公因子必须也整除它们的差 d 2 - d '。 个差是 


2,3,4,6,8，1，2,4,6，1，3,5,2,4,2，所以我们只须证明，给定的数中至多只有一个可 

由素数2,3,5的每一个所整除。显然仅仅6^ + 2是偶数，仅仅+ 3是3的倍数， 
而且至多只有一个5的倍数，因为％吴3 (modulo 5) 。 


设久 


n 


^pk 


o 


G - 1 / 6 


一 1 



ckl 2 k <： 


0 



对于某一个常数 


c 




. 错的，为看岀它是错的，可以以 



，我们有 t k <6 t 
是 : M -6 k = 


2来试它。 


k 


所以 


k 





0( 九 l0g 3 6 ) 



U 


s 


U (qs) mod Ko 特别是，如果 q = ~ 1，我们得到 H(- r ) mod K ^ 当计算逆变换 


时它避免了数据的翻转。 


10.A 


( 4 - 1， 


Sfz-j ，文 k - i - ， 


J 


0 


)可以写成 



CO 


2 


5 


^ ^ 4 


k 


V (气- 


k 一 


■) 



(JO tP U 


…<1 


p 


Q^p<K 




co tq v 


q 


0<q<K 


而这是 u p v q s (/>，(7)，其中|5(/>，(7)|=0或2 ; 。对于 f 和 g 的恰好 2 lk !2 j 个 
值，我们有 I S(p , q ) I 二 2\ 

11. 一个自动机在它有 c >2 之前不能有 z 2 = 1，这种情况在3_； - 1时对 M 7 首 
次岀现。由此得岀，在 3 Q -1) 的时间之前不能有 z 2 hq #000。 而且如果 M 7 
在时间〖时有 q 关0,我们不能把这改变成为 z 0 = 0 而不影响 输出； 但是这个输出至 


少在 t + j ~ l 的时间之前不会受 q 的这个值的影响，所以我们必须有 - 1 < 

2 n 。 由于我们给出的头一个论证证明 3 (j 故必定有40 - 1)<272，即 - 1 

即 j ^\_ nl 2] + 1 0 这是最好的界，因为对于所有 j^：\_n 12 i + 1，输人 w = r = 
2” - 1要求使用 iVT ; 。 （例如，表2显示为在时间3时乘两个二进位的数需要 M 2o ) 

12. 我们可以“扫描” MIX 类指令的 K 张表，在 0 (X + (N log A 0 2 ) 步内执行每 
个表上的头一条指令如下 ：（ i ) 一 个基数表排序 （5.2.5 小节）将在 0 (K + iV ) 的时 
间内把所有相同的指令集中在一起， （ H ) 每个 j 条相同指令的集合可以在 0 (log iV ) 2 
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十 0 ( 7 ) 步内执行，共有 o (/ v 2 ) 个这样的集合。有限次扫描将扫完所有的表，剩下 
的细节不难 处理; 例如，通过把 f 和 g 转换成二进制可以模拟算术运算 。 [SJCOMP 
9 (1980),490 〜 508。] 

13. 如果 n 位数乘法要花费 7X / 2 ) 步，则我们可以通过把《位数分成为 「 rz / ml 个 
m 位组，利用「 n / mlT ( m ) + 0(/2 + m ) 次运算实现 m 位数和 n 位数的乘法。因此 
正文中引用的结果给出了在图灵机上的估计运行时间 OU log m log log m )， 在可 

随机存取有界长的字的机器上的运行时间为 OU bg m )， 在指针机器上为 OU )。 

15. 已知的最好的上限是 0( n(log n ) 2 log log n ) ， 它是由 M . J . Fischer 和 

L.J • Stockmeyer 给出的 [/• Comp , and Syst . Sci . 9 (1974), 317 〜 331 ]; 他们的构造对 
于多带图灵机有效，而且在指针机器上是 0 (n log 7 Z ) 的。已知的最好的下限是 

n log nj log log n 阶的，它是 M ■ S • Paterson ， M . J • Fischer 和 A • R • Meyer 给出的 
[ SIAM/AMS Proceedings 7 (1974) ， 97 〜 111]; 这可应用于多带图灵机但不能应用于 
指针机器。 

16. 设/是超过 2 K 的最小的2的幂。置 a 广⑴- 心、 和匕― “ 2 nV /2 , 其 
中对于= 0。当 0<5< K 时，对于 r = 2 K ~ 2 - s 我们要计算卷积 c r = 

通过使用阶数为 V 的三个快速傅里叶变换，如同正文中的乘法过程 
一样，可以求出这个卷积。[注意这个技术有时称做“唧喳变换”，它对于任何复数 

，而不必是 1 的根都有效。参见 L . I . Bluestein ,Northeast Electronics Res. and Eng. 
Meeting Record 10 (1968) ， 218 〜 219; D.H. Bailey 和 P.N. Swarztrauber,S/AM Re¬ 
view 33 (1991) ， 389 〜 404。 ] 

17 . 量认二 + 1 满足 1^=2,!^ =2 D „ ，以及 D 2rt + 1 = 因此当 n 有 
所述形式时 ， D „ =2 〜_ f + 2 。 通过对 n 的归纳法，由此得出，仏 = 3' + E ； =2 3 e ^ 

一 勺 ― Z 十3 
乙 O 

顺便指出，是奇数，因此我们可以以+ K „ + 1 )/2 个1位乘法来用一个 
72 + 1位整数乘一个 n 位整数。生成函数= ^ n > l K n z n 满足^ = 

iC ( 之 2 )(s ： + 1)(z + 2 ); 因此 K( _ l) = l 和 K(l) = _ ^~。 

18. 下列方案使用工作存储器的 3 iV + S N 个位置，其中 S 1 =0, S 2w = S „ 以及 
S 2n -1 = S „ + 1,因此在上道题的符号下 Z +2 -[〖 = 1]。令 N = 2 n - 

(，其中 e 是0或1，并假定 7 V >1。 给定 N 位的数 “=2”^^+ %和。= 2”\^+ V 0 , 
我们首先把 I U 0 ~ U ^ mlVo - % I 构造成在 (3 N + S N ) 个位置的工作区域的0位 
和 n 位开始的两个 n 位区域。然后我们把它们的乘积放在以3〃 + S „ 处开始的工 
作区域中。下一步是构造在0位处开始的 2( n - d 位乘积 [/ i V 1; 使用该乘积，我们 
把在 3 n + S „ 位置处开始的_2< 个位置改成 U^Vi ~ ( Uq ~ U { )( V 0 - Vj ) + 
2 n U l V l 的值。（注意 3 n -2^ + 3 n + S rl = 3 N + S N 。） 最后，我们构造在0位置处开 
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始的 2 n 位的乘积 L 7 Q V Q ， 而且把它加到在2/7 + 和 3 ti 十 S „ 处开始的部分结果。 
我们还必须通过把它下移 2 n + S ， 7 个位置来把 2 N 位的答案移动到它最后的位 
置。 

通过一个比较巧妙的变形，即通过在指定的工作区域循环移动其输出一个给定 
的数量，可以避免最后的移动。如果不允许 2 AZ 位的乘积同辅助工作区域相邻，我 
们需要大约另外 N 个存储位置（即对于输入，输岀和临时存储，总数大约是 6 iV 而 

不是 5 N ) ;参见 R. Maeder ^Lecture Notes in Comp . Sci . 722 (1993) ， 59 〜65。 

19 •令 m — s 2 + r ， 其中 — 我们可以以 Ui = \_ul s ] y U 0 = u mod 5 ， V \ 

= lvls ], V 0 =v mod s 来使用 （2)， 且以 s 来起 2” 的作用。如果我们知道 U , - U 0 

和 Vi - %的符号，我们知道怎样来计算乘积 | L 7, - L / 0 I I V L - V 0 1 ，它小于 m ， 以 

及是加上或减去它。剩下的是乘以 s 和乘以/三 - r 。 利用习题 3.2. 1.1-9,这些的 
每一个都可以用四个乘法/除法来完成，但由于为计算 a mod m 所需要的乘法之一 
是乘以 r 或 r + s ， 因此只需要7个。因此14个乘法/除法就足够了（或者在 u = v 
或 m 是常数的情况下，12个就够了）。无须有比较操作数的能力，通过分开计算 

和我们仍然能以多一个乘法来完成这件工作。 

4.4 节 


1 • 我们通过巧系统中的加法和乘法来计算（… （ a m b m - x + ^ ^ +…+ 


0 + a 0 o 

T 

= 20 (cwt 

= 8 (st 

= 14(lb 

- 16oz))) 

以0开始 

0 

0 

0 

0 

0 

加3 

0 

0 

0 

0 

3 

乘以 24 

0 

0 

0 

4 

8 

加9 

0 

0 

0 

5 

1 

乘以60 

0 

2 

5 

9 

12 

加 12 

0 

2 

5 

10 

8 

乘以60 

8 

3 

1 

0 

0 

加37 

8 

3 

1 

2 

5 


(在一混合进制系统中的加法和乘以一个常数的乘法可以很容易地利用通常进位规 
则的一个简单推广 完成; 参考习题 4.3. 1-9。） 

2 . 我们计算 L w / B。」，LL 」等等，余数是 A 0 , Ai 等等。除法在系统 

中进行。 
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题答案 


d =24(h = 60(m = 60s)) 

由 m 开始 3 9 12 37 

除以 16 0 5 4 32 余数 = 5 

除以14 0 0 21 45 余数= 2 

除以8 0 0 2 43 余数二1 

除以20 0 0 0 8 余数= 3 

除以 00 0 0 0 0 余数= 8 

答案：8 T 3 cwt 1 st 2 lb 5 oz 。 

3. 下面是由 G . L . Steele Jr . 和 Jon L . White 给出的过程，它推广了 Taranto 对于 
B =2 的算法。 Taranto 的算法原来发表于 CACM 2，7 ( 1959年7月），27。 

A 1 •[初始化]置 M —0， L / q — 0。 

A 2. [完成了？]如果 u <( 或^>1_ ^则转向 A 4 步。（否则没有 M 位小数 

能满足给定的条件。） 

A 3• [变换]置 M—M + l ， L /_ m — LBw 」， u^~Bu mod 1 ， < — 及，并返回 A 2。 

(这个变换实质上把我们送回到原来所处的 状态； 剩下的问题是以最小的 
B 进位数把〃转换成 L /， 使得 | U - u \<“ 但是，注意 e 现在可以大于等 
于1;在这种情况下，我们可以立即转到 A 4 步而不是存 f 的新值。） 

A 4. [舍入]如果1/_%加1。（如果 w 精确地等于士，则可考虑采 

用别的舍入规则，例如“仅当它为奇数时1/^加1”；参考 4.2.2 小节。） 

I 

步骤 A 4 绝不会把 -1 增加到 B ; 因为如果 L / — M = B -1， 我们必定有 

M >0, 但是没有 M -1 位小数是充分精确的。 Steele 和 White 在他们的论文[5仏_ 
PLAN Notices 25,6 (1990 年6月 ） ，112〜 126] 继续考虑了浮点的转换。也请参见由 

W . H . J.Feijen 等人编辑的 Beauty /s Our Business (New York ： Springer , 1990) 中 
D . E.Knuth 的文章， 233 〜242。 

4. ( a ) l /2^5 Vl 0 ' o ( b ) b 的每一个素因子整除 B 。 

5. 当且仅当 10”- l < c < m ; 参考(3)。 

1 . au ^ ux^au + u / w^au + 1, 因此|_ 0 ^」<|_似」< 1 _抓+ 1」。而且，在引用的 

特殊情况中，对于0< f ^«我们有+ a 且 Law 」= Law + a _ e 」。 

8. ENT1 0 

LDA U 

1H MUL = 1//10 = 
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3 H ST A TEMP 


4.4 节 



MUL =-10 = 
SLAX 5 


JANN 2 F 

LDA TEMP (由 习题7,仅在头一次 

迭代时才能出现） 

DECA 1 
JMP 3 B 

2 H STA ANSWER , 1 (可能是负 0) 

LDA TEMP 
INC 1 1 
JAP IB I 



令 N 




2 2 


k 


这个计算置 


V 


( 2 2 - 1 ) (2 


4 



1 ) (2 


8 



1 ) 


(2 2 



1 ) 


2 1 


2 4 


2 8 


2 2 


U 



1 ) 




N - 1 
N 


u 



1 ) 


因此 g = LW10 + 〜」，其中 q = ^(1 -U + 1)/ N )。 由于 N mod 10 二 6 而且对于 0 

< w < N ，0< q < 1/10,我们看到对于 0< w<N + 4 ，g 二 Lw / l0」 o 

当 w 在这个范围中时，我们有 r 二 u mod 10 + Ll _ ( w+1 + 5(9 W )// V 」， 其中 Q u = 


+ _ d |。 如果九很大，比如说 ^ = N /8- r ， 其中 0< r < N /40, 我们 

有 u + 1=5^ (modulo iV /8); 因此如果 N /2 ，则 w 十 1 十5心 < iV 0 否则 （9 W < ] V /8 

- N /40= N /10, 如果 w < N /2 再一次我们有 u + 1+ d u < N 0 u = N /2, N /2 + 1, N / 
2 + 2 和 N /2+ 3 的情况容易看出不会引起问题。但当 u 二 NI 2 十4 时我们发现 W 

mod 10 = 2以及 r - l 0 

[另 一 个方法 r^u — Sq , r — r —2 q 将在 一 个更大的范围内有效，但在一台8 

位计算机上就不太快了。本题是以 R . A . Vowels .Australian Comp.J 24 (1992) , 81 
〜85的思想为基础的。] 

10. (0 右移1位； （ ii ) 抽取每个组的左边 一 位； （ iii ) ( ii ) 的结果右移两位； （ iv ) ( iii ) 
的结果右移一位，并把它加到 （ iii ) 的结果； （ v ) 从 （ i ) 的结果中减去 （ iv ) 的结果。 

11. 5 . 7721 

- 10 

47.721 
- 9 4 
383.21 
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题答案 


- 76 6 
3066 .i 

- 613 2 

2452 9 答案：（24529) 10 

12 . 首先把三进制数转换成九进制，然后如同八进制到十进制的转换一样进 

行，但无须加倍。十进制到九进制的转换是类似的。在给定的例子中，我们有 

1.7 6 4 7 2 3 9.8 7 6 5 4 

-1 

1 6.6 4 7 2 3 
- 16 
1 5 0.4 7 2 3 
- 15 0 
1 3 5 4.7 2 3 
-13 5 4 
12 19 3.23 
-12 19 3 
1 0 9 7 3 9.3 
-1 0 9 7 3 9 

9 8 7 6 5 4 答案 = (1764723) 


1 1 8.7 6 5 4 
+ 118 
13 16.654 
+ 13 16 

1 4 4 8 3.5 4 
+ 1 4 4 8 3 

1 6 0 4 2 8.4 
+ 1 6 0 4 2 8 

1 7 6 4 7 2 3 


答案：（987654) 1() 
13. 


BUF 

ALF 

• LJ LJ LJ 


ORIG 

* + 39 

START 

JOV 

OFLO 


ENT2 

_ 40 

8H 

ENT3 

10 

1H 

ENT1 

m 


ENTX 

0 

2H 

STX 

CARRY 


鬱 ■鬌 

J1P 

2B 


SLAX 

5 


CHAR 


(小数点在头一行) 

确保溢岀开关断开 
置缓冲区指针 
置循环计数器 
开始乘法程序 


(见习题 4.3. 1 _ 13，且 二 10 9 和 W = U ) 
rA —下 9 个数字 


610 


STA 


BUF + 40,2(2 ： 5) 


存下9个数字 


4.4 节 


STX 

BUF + 41,2 


INC2 

2 

缓冲区指针增值 

DEC3 

1 


J3P 

1B 

重复 10 次 

OUT 

BUF + 2 0,2 (PRINTER) 


J2N 

8B 

重复直到两行都打印完毕 



14.设 KU ) 是为转换一个 n 位数字的十进制数成为二进制数，同时计算10” 
的二进表示所需要的步数。则我们有 K (2 n )<2 KU ) + 0( MU ))。 证明： 给定数 
U = (W2，,-1 … “0)10, 在步内计算 L 7 i = ( U2r! - I". )10 和 Uq = … Wq ) 10 

以及10”，然后在 0( M ( n )) 步内计算 L/sHTW L 7 0 和10 2 ” = 10" • 10”。由此得 

出 K (2 r, ) = 0( M (2 f, ) + 2 M (2 n ~ l ) + 4 M (2 f, ^ 2 ) + … ） = 0( tzM (2”）） 。 

[类似地， Schenhage 已经发现，我们可以在0 UM(2”）） 步内把一个 （2”lgl0) 位 
数 L； 从二进制转换成十进制。首先在 0(M(2 W _ 1 ) + M(2〃- 2 ) +… ）= 0(M(2”）) 

步内形成V 二 10 2 ” _1 ，然后再用 0(M(2”）） 步计算 U 0 = (U mod V)和 U { = lU / 
V」，再转换％和 L7 10 ] 

17. 参见 W. D. Clinger y SIGPLAN Notices 25,6 (1990 年 6 月），92〜101 以及习 
题3的答案中引证的 Steele 和 White 的文章。 

18 •设 L7 = round B ( w ， P ) 和 i; = round/, ( U , p ) 0 我们可以假设 w >0,使得 

L />0 和 r>0。 情况 l，u< w: 确定 e 和£，使得 V — ，5 £_1 <17<5 £ 。然 

后 t/<L/ + > E_p 和 U<：u — |^ —户；因此，矿 1 

情况2，1；>“ ： 确定6和£：使得6「】<«<6'_8 £_1 <17<5 £ 。然后 u>U ~ 

士 J3 £ - p ，而且 +士^ -/> ; 因此 B p ~ l <： B p ~ E (U ~ B E ~ p )< B p ~ E u <： b p ~ e u < 

b p 。 于是我们证明了每当 v 关 u 时， 

反之，如果 B p ^< 沪，则上述证明提示，当 w 是6的乘方且同时接近于 B 的一 
个乘方时的最为可能的例子将出现。我们有 B p - l b ^< B p ^ b ^^ rb p - 


ISo 由习题4.5.3-50，有整数6和£使得1%以<4(^6-£<1呢^。因此对于某 

个 emE f a<b e lB E <^o 现在我们有 round B (b e ,P) = 护，以及 round, ( , P) < 

if。[CACM 11 (1968), 47 ~ 50 ；Proc.Amer.MafL.Soc. 19 (1968) ，716〜723。 ] 

例如，如果6户=2 10 和 B p = 10 4 , 数 z/ =2 6408 〜 .100049-10 1930 降低成 U= .1- 
10 mo 〜（.111111111101111111111)2 • 2 64 ° 8 , 它降低成 2 6408 - 2 6398 。（由 Fred 

J. Tydeman 发现的最小的例子实际上是 round (( . 1111111001 ) 2 * 2 784 ) = . 1011 * 



因此 l<a = l/ 1- 


2 



P 


< 1 + 


2 


B 


i-p 
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习题答案 


10 236 ， round (.1011* 10 235 ) = (. 11111110010) 2 • 2 784 。 ） 

19 .w = ( F 0 F 0 F 0 F 0 ) 16 ，q = 1 - 10/16使 ((々“ 6 ) 10 ".(“0。） 10 ) 256 ; 于是 
m 2 = ( FF 00 FF 00) 16 , c 2 = 1 - 10 2 /16 2 使得 L 7 = (( u 7 u 6 u 5 u 4 ) io ( u 2 u 2 u l u 0 ) l0 ) 65536 ; 
以及 m 3 = ( FFFF 0000) 16 , c 3 = 1 - 10 4 /16 4 完成了这一工作。[试同习题 14 中的 
Schonhage 算法作比较。这个技术是由 Roy A . Keir 在大约1958年时给岀的。] 

4.5.1 小节 

1. 测试是否因为分母为正。（参见习题 4.5.3-39 的答案。） 

2. 如果 C > 1既整除 w / d 也整除 r / d ，则 cd 既整除 W 也整除 T ；。 

3. 设 f 是素数。如果对于 e > l ， p e 是 uv 和 z / t / 的一个因子，则或者，\ w 和 

p e \ ^或者 〆 \ W ' 和 〆 \ I ；;因此 〆 \ gcd ( u , t / ) gcd ( u ’ ， V )。把这个论证的次序 

反过来即得出它的逆。 

4•设 di = gcd ( u , v ) y d 2 = gcd ( 答案是 iv = ( u / d { ) ( v ' I d 2 ) sign ( v ), 

u / 二 \( u / ld 2 )( vld l )\ ，而且如果 P = 0 则带有“除以 0” 的出错信息。 

5. di = 10, r = 17 -7 -27* 12= - 205 , d 2 = 5 .uj = - 41, w ' = 168 0 

6 . 设 u 〃 = u ' I d y ， v " = v \ d \ ; 我们的目标是证明 gcd ( uv ' + uv — gcd ( uv ' + 

， A “ V )。 如果是整除 z / 的一个素数，则 P 不能整除^或^，所以 > 不能整除 

UV " + U "V 。 对于/的素因子类似的论断成立，所以//没有影响给定的 gcd 的素因 
子。 

7. ( iV - l ) 2 + (] V -2) 2 = 2 iV 2 - (6 N -5)。 如果输人是”位二进位数，则为表 
示 t 可能需要+ 1位。 

8. 假定工 是有限的且非0,对于乘法和除法，这些量将遵守规则 x /0 = sign ( x )- 

oo ，（ ±oo)X：r = :cX(±oo)：= (土 oo)/：c = 土 sign( > z )<^ ，: c /( ± ⑺） = 0, 而无须改变 
所述的算法。其次，这些算法很容易修改，使得0/0 = 0 X ( ± ex. ) = ( 土⑺ ） X0= “（0/ 

0)”，其中后者是“不确定”的一个表示；如果这两个操作数之一“不确定”，则结果也 
将“不确定”。 

由于乘法和除法子程序可以产生这些推广的算术的相当自然的规则，有时值得 
修改加法和减法运算，使得它们满足以下规则 ：对于 有限的± - = ± 00，工± 

(-oo) = + oo ; (+oo) + ( + oo)~ ± OO - ( + oo ) = ±00; 而且 （土 oo) + (=Poo) = 

(土 00)-( ±^) = (0/0); 而且如果两个操作数之一或两个都是 （0 / 0) ， 则结果也是。 
相等测试和比较可以用类似的方式处理。 

上边的注释是同“溢出”指示无关的。如果 oo 用来提示溢岀，那么命1/00等于0 
是不正确的，因为这样会把不精确的结果当成真正的答案。用 （0/0) 表示溢出，而且 
坚持这样的约定，即如果至少有一个输人是不确定的，则任何运算的结果也不确定， 
这样做更好一些。这种类型的溢出指示有这样一个优点，即推广计算的最后结果确 
切地揭示哪些答案是确定的和哪些是不确定的。 
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4.5.2 小节 


9 • 如果 w / / # W / ，则 I wt / - z/r | = u ’ v ’ \ u\u - vl v ’ \ < I 2 ln uju - 
2 2 ~/ i /| ; 相差大于 1 的两个量不可能有相同的“底限”。（换言之，当分母有 n 位 
时，二进制点右边的头2” 位足以表征二进分数的值。我们不能把这改进成2〃 - 1 

位，因为如果 n =4,则我们有& = (.00010011 …） 2 ，& = (.00010010 …） 2 。） 

11•当 w 和 x/ 不全为0时，为了除以 （w + t/M)/i；〃， 可乘以倒数（I； - v / ^j5)v // l 
(t； 2 - 5i/ 2 ) ，并约简到最低项。 

12. ((2「 1 -1)/1);咖1^1(：0 = (0/1)当且仅当|工|<2 1 1。类似地， nxmdU) 

= (1/0) 当且仅当 

13 . —个想法是限制分子和分母总共为27个二进位，其中我们仅需要存其中 
的26位（因为分母的前导位为1除非分母的长度为零）。这就有位置来保留一个符 
号位和另外的五位以指出分母大小。另一个想法是对分子和分母使用28个二进 

位，它们至多总共有7个十六进数字，连同一个符号位和3个二进位的字段在一起 
以指出分母中的十六进数字的个数。 

[利用下题中的公式，头一个办法精确地导致2140040119个有限的可表示数， 
而第二个办法导致1830986459个这样的数。头一个办法是可取的，因为它能表示 
更多的值，而且因为它是更干净的并使范围之间的转换更为顺当。类似地，对于64 
个二进位，我们将把分子和分母限制成总共至多有 64 -6 = 58 个二进位。] 

14. 在区间 （a，6] 中”的倍数的个数为 L6/n」-La/rz」。 因此，由容斥原理，这 

个问题的答案是 s 0 — s: + s 2 -…，其中心是 - LMi/ pwaA /p」 

- LaVp 」）， 这个求 和对々 个不同素数的所有乘积 p 进行。我们也可把这个答案表 
达为 


min( A4" 2 * N 2 ) 

2 "(” ）（ l _ M 2 /? 2 」 ~iM [I n ]) (LN 2 / n \ ~\_N 1 I n\) 

n = 1 


4.5.2 小节 

1 •把 gcd , lcm , X 分别一致地替换成 min ， max , + (在确保当任何变量为零时， 
恒等式仍然正确之后）。 

2 -对于素数 h 设〜，是"，％，•••，％的规范分解中 p 的指数。由 

假设， U p < v vp + …十 v np 0 我们必须证明〜，％々）+ — + mm ( u p , ,如 

果心大于或等于每个或者心小于某个则这肯定为真。 

3* 解法 1:如果”=，广.沁，在每种情况下的数是（2~ + 1广"（2〜+ 1)。 解法 
2:如果对于72 2 的每个因子1我们置 w=g C dU，/0 和 r=;z 2 /lcmU，n)， 则得到一 

对 一 的对应关系 。 [E ‘ CesAro ， Arm W di ‘ Matematica Pura ed Appli cat a (2 ) 13 

(1885),235 〜250, § 12。] 

4. 见习题 3.2.1.2_15( a )。 
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习题答案 


5. 右移 w 和 u 直到它们都不是3的倍数为止，并记住将在 gcd 中出现的3的正 
确指数。每个随后的迭代置4 - u 或 w - i ； (不论哪个是3的倍数），右移 z 
直到它不是3的倍数为止，然后用此结果代替 max (^, T；)o 


U 

V 

t 

13634 

24140 

10506,3502； 

13634 

3502 

17136,5712,1904; 

1904 

3502 

5406,1802； 

1904 

1802 

102,34； 

34 

1802 

1836,612,204,68； 

34 

68 

102,34； 

34 

34 

0 

现在 gcd (40902,24140) = 

= 34是铁证如山了。 



6. w 和 d 两者都是偶数的概率为两个都是4的倍数的概率为等等，于 
是， A 有由生成函数 


3 

4 




3/4 

1 - z /4 


给出的分布 o 均值是 | ，标准差是^/吾+ + _ + =吾。如果“^对于， ^<2 N 

是独立和一致地分布的，则需要某些小的校 正项； 而均值实际上是 

(2 n - 1) _2 X 1(2 N ^ - I ) 2 = \ - \{2 n - l )^ 1 + N (2 n - I ) -2 

7. 当不全为偶数时，情况(偶，奇 ），（ 奇，偶），（奇，奇）的每一种都是同等可 

能的，而且在这些情况下 B = 1，0,0。 因此平均说来 B = 实际上，如同在习题6 

中那样，当 1< w ， x ；<2 n 时应给出小的校正使之严格地 精确 ； B = 1 的概率实际上 
是： 

(2 iV - l)" 2 y ； (2 ,v ^ - l)2 N ~ k = 去 - 去 (2 N - I)- 1 

8. 令 F 是其中 M > t ； 的减法步骤的个数。于是 £ = F + B 。 如果我们把输入 
从 U A ) 变成(^0,则 C 的值保持不变，而 F 变成 C -1- F 。 因此 £ ave = j ( C ave - 

1 ) + B ave o 

9. 二进算法首先以^ = 1963,^ = 1359到达 B 6。 然后604 ， 302 ， 151 ， 等等。 
• 614 • 


4.5.2 小节 


因此 gcd 是302。利用算法 X ，我们求得2 • 31408 - 23 • 2718 = 302。 

10. a ) 两个整数互素当且仅当它们不同时被任何素数整除。 b ) 借助于分母 
々二仏…么，重新排列 a ) 中的和（注意 a )， b ) 中的每个和实际上都是有限的）。 c ) 由 

于 (n I k ) 2 - [.n/k] 2 = 0(”/々），所以我们有 _ = { fd(k) (n! k) 2 - { 0(nl k) 

-0( nHjo 而且 S „ >7? (/7 M ) 2 = 0(72)。 d ) ^ d \ Tl /^( d ) = S ln o [事实上，我们有 

更为一般的结果 



如在 b) 中那样，其中右边的求和是对于72的素因子进行的，如果72 == 则这 

等于 n s (l ~ llp \) 4t ' (1 ~ 1/ p s r ) o ] 

注: 类似地，我们发现6个整数的集合互素的概率是 lk ( k ) = ll ( Un k )。 

定理 D 的这个证明见 F.Mertens，CreHe 77 (1874) ，289〜291。这一技术实际上给出 
了强得多的结果，即当 m ^ n 时，对于任意的/和 g ，有 6 tt _ 2 m/2 + 0 (n log m ) 对整 
数 w G [/( m ),/( m ) + m)，uG[g(r2)，g(n) + n) 互素。 

11. (a) 6/ tt 2 乘以 1 + I + 如即 49/(6 tc 2 )々 .82746。（b) 6/ tt 2 乘以 l/l + 2/4 + 

3/9 + …，即〜。（不管习题12和14的结果怎样，这都是真的。） 

12 . [Annali di Mat • (2) 13 (1885) ，235〜250， §30] 设 jU ) 是 n 的正因子的个 

数。答案是 


[于是，平均值小于2,尽管当不互素时至少总有两个公因子。] 



14. (a)L = (6/ 兀 2 ) I ： d > l d~ 2 ln d 二- ^ (2)/^(2) - 2^ 索数 （In p )(2 p - 1 ) 〜 

0.56996。 （ b ) (Sl^)y： d>[ [d 奇数; U _2 ln d = L~j In 2 X ).33891。 

15. ± vlu 3 ， v 2 = TWz / 3 ( 符号依赖于迭代次数是偶数还是奇数）。这由 w 

和巧彼此互素（在整个算法期间）这一事实以及 = 得出。[因此在算法结 

束时^〃=10^“，1；)，但是这不是计算最低公倍数的特别有效的方法。关于它的 

一 个推广，请参见习题4.6.1-18。] 

在习题 4.5.3-48 中可以找到进一步的细节。 

16 •应用算法 X 于 t ; 和 m , 于是得到 一 个值： r 使得 : (modulo m ) 。（简化 
算法 X ，使得 z / 2 ，巧和 G 不必被计算即可做到这一点，因为在答案中绝不使用它 
们。）然后置 vo^ux mod m 。[像在习题4 .5. 3~45中那样，因此得出，在把它应用于 
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习题答案 


很大的 n 个二进位的数时，这一过程需要 0U 2 ) 个时间单位。关于算法X的其它 
变化，参见习题17和39。] 

17. 如同在牛顿方法中那样，我们可以令 z/ = (2 w -x^ 2 )mod2 2e (SM4.3.1 小节 

末尾）。等价地，如果 uv ^\ + 2 2 ^w( modulo 2 2 ^ ) ，令 u — u +2^(( — uw ) mod 2 e ) 0 

18 . 设除 W 和之外 , U {9 U 2 yU ?> yV i yV 2， V - T > 也是多精度变量 D 推广的算法将和 

算法 LS U 和所做的那样对 〃 3 和 M 起作用。在步骤 L4 中，新的多精度运算是 
^1* 所有 j , S t^—Auj Bvj , Cuj , ud^—ud + Dvj ， u'j — t , Vj^—w ; M 且在这— 

步如果 B = 0，则对于所有和对 (？ = L w 3 / 」，置 t^-Uj - qvj , u ^ Vj，Vj — t 。 如果 

巧 很小，则对步骤 L1 也做类似的修改。内循环（步骤 L2 和 L3) 不变。 

19 . a) 置 = x + 2 y + 3之；则 2 z = 1 ^ 5 t ^ — 3 y — 202二3。消去 y ，则 

■ 

14^! - 14z = 6 :无解。 b) 这时 lAt \ - 14z = 0 o 除以 14,消去 q ; —^般解是 x = Sz - 
2 f y = l ~5 z f z 是任意的。 

20. 我们可以假定 m > n 。 如果 m>rz =0, 对于我们可以以2〃 的 
概率得到（抓 - 〖，0)，以 2— 771 的概率得到（0,0)。正确地说，对于 n >0,下列的值都 
可得到。 

情况 l , m 二 n 。 对于 2<z< 72,我们以"2£-5/2 / + 1 十3/2 2 ，的概率从（77,77)转 

到（72 - ,，72)。(这些值是▲，盖，^&，…。 j 转到 （0 ，” ） 的概率是 1 ~ 1/2 72 2 十 
ll 2 2 n - 2 。 转到 U,々） 的概率和转到 U，7Z) 的相同。这个算法以1/2” _1 的概率终止。 

情况 2， m 二 n + 1。当72 > 1时，我们以■的概率从 （72 + 1，72)达到（?2,72),或者 

当72 =1时概率为0;对于< 72 - 1，以11/2〃 3 - 3/2〜 + 1 的概率达到 （72 - r， 72)。 
(这些值是 m， …。)对于72 >1，我们以5/2” + 1 -3/2 2 ^ 1 的概率达到 （l，n); 

以3/2 2 ”-1/2 2 ” — 1 的概率达到 （0，n)。 

情况 3，m>/i+2 0 概率由下表 给出： 







n , n 





1/2 


- 3/2 


m - w + 2 


^1/2 


m + 



Il 2 t + 3 l 2 m ' 71 + t + \ 1 < t < n 

1/2" + l/2 m , n > 1 

1 / 2 … + S n l2 m ' l^t<m 


n 


(0^)： l /2 m - 1 

关于这些结果惟一有趣的事情是它们竟如此地乱七八糟，但这也就使我们对它 
们毫无兴趣可言了。 

21. 证明当 m 很大时，对于固定的 r 和对于算法的每个减法移 
位周期把 Llg 平均减2。 

22. 在 w 已经右移成为奇数之后，在1< 的范围内恰有 （/V - m ) • 
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2 


m — 1 + 厶 


m 


。个整数^有 Llg ^ 




m 


o 


(2 n - 1 ) Z C = N Z C 


2 


00 



2 N 



于是 

(N — n ) 2 n 


一 1 


c 


n 



l < n<N 


2 


I ： 


(N ~ m)(N - n )2 


m 


+ n 一 2 


C 


m n 




(N - nY 2 


2^2 37 — 2 


c 


nn 


1^ n < 




(借助于和对于 D 同样的公式成立。) 


中间和是2 2 


/V-2 


2 


mn 2 


m 


” （U + /?) N + / 


am 


/? n ) 


由于 


Q^m< n<N 


m 2 


m 


2 - 


n 



1)2 


1 - n 


和 



m v m 


- 1)2 


m 


4 - 


n 


+ n + 2)2 


l — 71 


O^m n 


0^ m<i n 


因此对 772 求和是 


2 2N 2 n 2 n [ (y — a — ( 3 n 

0< r/<N 


a (4 — ( n 2 + n + 2 ) 2 l ~ n 



( a 



卢) N )(2 - (n + 1)2卜”）- 


2 


2N-2 



a + / 3 ) N > : n 2 ”（2 _ (72 + 1)2 


\ - n 



0( D ) 


n >0 


因此答案中 U + /?) iV 的系数被求出为 2 
用于其它的求和。 


一 2 


4- 


4 


3 



11 

27 


o 


个类似的论证也适 


注：借 助于一般的分部求和公式，在经过某些冗长的计算之后，可以得到这些和 


的精确的值。分部求和的一般公式为 




m 




m 


m 


0^ k<rt 


(1 - z ) 


m + 


2 


rnhi 


m — k n + k 
- 2： 


(1 - 


2： 


+ 1 


23 •如果：，它是 Pr ( 和 vl u ^ x ) = f(l _ G „( x ))。 而且如果： c > l ， 


它是 f + Pr ( w < z ; 和 vl u^ll x ) 

（x )) 0 


2 + 言 hd / x ); 由 （40)， 这也等于 f ( l - 


24. S , >1 2^ G ( l /(2' + l )) = S ( l ) o 这个值同经典的常数没有明显的关系，它 


近似于 0.5432582959 


o 


25 . Richard Brent 已经指出， G ( e 〃） 是一个对于所有 y 的实值解析的奇函数。 


如果我们令 G(e 


: y 


义 1夕 + A 3 3 ;3 + ^5^ 




p(e 


y 


-1 ) ，我们有- P 1 




P2 




2 


A , 


P3 





A 3 ，04 


4 





2 


义 3 ， ~ P5~ 




+ 



4 


A3 + a 5 ； 


- D >, 



n 


- k - 



t A 



n ： 


n 


2 


n 



k 



n ! 


Ph 


最初的一些值是 h 〜 .3979226812, A 3 •0210096400, A 5 〜 .0013749841 ， A 7 〜 


- .0000960351。 乱猜 ：lim 


( - A 


2k + 


\l ^2 k -1 


l / TC 2 o 


* 
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题答案 


26■由 （39) 左边为 2 S ( llx ) -5 S ( ll 2 x ) + 2 S ( l /4 x ) ~2 S ( x ) +5 S (2 x ) 


2 S (4 x 


由 （ 44 ) 右边是 S (2 x )-2 S (4 x ) + 2 S ( l / x )- S ( l /2 x ) - 2 S ( x ) + 4 S (2 x 


4 S ( l /2^：) +2 S ( l /4 


X 


1 ， :r 


i /々 和 


X 


多给出 2 G (4^) -5 G (2^) + G (^ 2 /2) - G (^ 3 ) 


今 的情况也许是最有 趣的； 例如 
= 2G(2^ 2 )o 




27•当72 >1 时，由习题 1.2.11.2-4,20, 


2： 




々>0 


2 


-2k ^2 - 1 / :」 


s 


Tji^o(jzl2 


2 


/>>! 


2 


一々 （rz + 1) 


S 


2 - 1 •« 一 1 






2 


一々 （ ” + 1) 


s 


n - 1 


72 B .(,-/)/ 而且当然 


2 


k >\ 


2 


H / + l ) 


1/(2 


— 1)0 


28 .如同在习题 6.3-34( b ) 中那样，令 S ,( m ) = E 


m 一 1 


T (1 - kl m) n 和 T ^( m ) 




1 / 


nl m 


-1)， 我们求得 S n ( m ) = T ; J ( m ) + 0 (e 


nl rn 


n m 


2 ) 和 2 ( p 71 + 1 — 2^^ 2 j S }l (^) 


r ;i + O (n 


) ，其中 ^ = S ^ i 2 


-2； 


T ; J (2 ; ) o 由于 r , 2 + 1 < ，而且 4 r 2yl 


r ” = l /( e ” — 1) 


为正但指数地很小，由此得出 


0( n 


- 9 


O 


更多细节可以通过写出 


2 tt 1 


: Z 


3/2 + i 


(z)r(z) 


3/2 十 ioo 


J 3/2 —i 


2 7 


K2- 


dz 


2tc\ 


3/2- 


( z ) T ( z)n 


2 


2 - z 


V J _ 1 _ 丄 KKz ) V { z)n ^ = 丄 

2 2; e nl2 j _ 1 27Ti^」 3/2 —ice 2 j(2 ~ z) Z 2^rij 3/2 _ joo 2 2 ~ z - 

得到，这个积分是在极点 2 + 27riA/ln 2 的剩余之和，即乘以 7^/(6 In 2) 

其中 


dz 



/(”） ， 


/( n 





2 mkl In 2) F (2 



2 mkl In 2) exp ( - 2丌以 lg w )/ In 2) 


k>l 


是其“平均值”为零的 lg 72 的一个周期函数。 


29.( 由 P . Flajoiet 和 B . Vallee 给出的解）如果 fix 


S 


k ^[ 


2 


- k 


g (2 


X 


) 和 


g 


g ( 


X ) X 


s — 1 


dx ， 则在适当的条件下 ， /x 


2 


k>i 


~ k(s 1) * 

2 g 


g 


5)/(2 5 + 1 -1)，以及 / U ) 


C + L 


2 tti 


r 


X 


5 cb 。 令 g (: r 


1/(1 + 


X 


，我们 


c 


求得，当0<況5<1时，在这种情况下的变换是 g 




丌 /sin 


ns : 


因此 


CO 



2 


1/2 + i 


TC：C 


2 



2 


x 


2 n \ 


1/2 


OO 


(2 


s +1 


ds 


一 l)si 


Sin 7 T ^ 


7 t 


由此得出，对于 ％< o ，/ ⑺是^ 


S 



1(2 


s 


— 1) 的剩余之和，即 l + X lg x + Y x 




2 , 4 

P(lg x ) —+ -^rx 


8 



jr 4 + 


，其中 


，、— 2 tt sin LTimi 

t In 2 . sinh (2 m 7 r 2 / ln 2) 


oo 


sin 2 tz mt 


是其绝对值绝不超过 8 X 10 


一12 


的一个周期函数。 （ PU ) 是如此之小这一事实促使 


Brent 在他原来的论文中对之忽略不计 


O 


对于 - l <5 h <0，/( l / x ) 的 Mellin 变换是 /* ( i ) 




W (( l -2 ! 


s 


sin tts ); 因此 
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fdlx ) 


- 1/2 + ; 


2 Tci … 


1/2 - i 


K 

sin ns 



s 6sl(l-2 


\ ^ s 


) ，而且我们现在要求对于 - 1 ，被积 


项的剩余 : /(1/x) 

—/(工），由此得出 





X 



x z + 


_藝 ■ 


[ 这个公式也可直接得到。 ] 我们有 Sjo ： 


X 


G[(x) - /(x) - 2 lg :r 十 + xP(\g x) ~ i + 工十 （1 — x z ) ( Kx 


其中 <f>(x) 


E ： =0 (-l)V/(2 


_ Do 


30 .我们有 G 2 (x) 




2 V {x) - lydl x) + 2 2 {oc) - 2 2 (lix) ，其中 




s - 

k t l^l ^ 



1 



2 


， 2 


X 


X 


y 丄 _ 1 _ 

Oi. 2M + 2 Z + 2 k x 


Mellin 变换是 & 

其中 


Tt 


( s ) ^ s ^ s a(s)l(r ~ lhI 


s) = ^ m ^~ s b(s)l(2S 


_ 1) ， 


a 


(s) 




2 


(1 



2 


-l \s-[ 


2 


21 


k^O 


5-1 

k 


2 k+1 - 1 


b( 





1) 


5-1 




k^O 


-1 

k 


2 k ^ l ~ s - 1 


因此对于 0<x<l ， 我们得到下列展开式 


- Si ( x ) 


( 0 ) 


x + - a {\) x!\n 2 + xA (ig jc) - 


2 


一 1 


S ~ a (- 々)( - 工)々 

k ^2 ^ ~ ± , 


X 2 ^x) = 6(0) + 6( - 1):( lg :c + 了 ）- b' {\)xj\n 2 + xB(\g jc) - 


又 （ 1/ 


X 


么 （ 1/ 


X 


b { s ) 


A(t) 


E 


2 


-1 


/ i . J 。左 一1 1 

k>2 丄 _ 丄 


b ( - k ) ( - x ) 


k>l 


― a ( k ) ( — x ) 
~ ^+ 〖 - 1 


2 卜 工 一 5 ⑴ 一 i - + Pk([gx 


k ^\ 


s 


2 


5-1 



r^k + l ~ 5 — i 

2 丌 i 


In 2 


❾ Uh ( 2WA n 2〆 — 1 



2 m ml in 2 )e 


— 2m ni t 


B(t) = 




In 2 




rn 1 


2 m 

sinh ( 2/72 7^/111 2) 


b(~ 1 



2 


m 7 Ti 


i/ln 2) 


e 


27)17Ut 
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( _/_ 2 rci _/ k - 1 ~ 2 mml\n 2 \ - 2 mmt \ 

k In 2\ sinh (2 mTc 2 /ln 2) \ k — 1 j ) 

34 .利用一个十分不同于 Brent 的方法 ， Brigitte V allee [Algorithmica 22(1998) ， 
660〜 685] 已经求得对于算法 B 的一个优美而严格的分析。确实，她的方法很不同， 
人们还不知道用来预测和 Brent 的启发式模型一样的特性。因此，分析二进制 gcd 
算法的问题（现在已头一次获得严格解决），仍在诱发高等数学的更多亟待解决的问 

题。 

35.由归纳法，当时，长度是 m + ln /2] + 1 - [m = 72 = 1] 0 但习题37表 
明，算法不会像这么慢。 

36 •设 a n — (2 n ~ ( _ 1 广 ）/3; 则 aQ 7 a \ ，〜，…= 0,1,1,3,5,11，21，…。（这个数 
列的二进表示有有趣的0和1的模式。注意，〜= +2 a „_ 2 ，而且 a n + a n + l = 

2”。）对于7?1>72，令 “=2讲 + 1 -\ +2 ， 1 ； = \ +2 。对于 m 二 n >0，^ u = max ( a r3+2 , 

+ — 对于 m = 72 〉0情况的另一个例子是 w = 2 n + 1 ~ 2 y v = 

2” + 1 -1;这个选择要做更多的移位，并给出 B = 1， C = 72 +1， D =2”，£= ”，这是对 
于程序 B 最糟的情况。 

37. ( 由 J . O . Shallit 给出的解）这个问题看起来有必要证明比要求证明的更多的 
东西。令 S ( W ， iO 是在输入 m 和 w 时由算法 B 所采取的减法步骤的数目。我们将 
证明， SU ， tO<lgU + w )。 这意味着，如所要求的那样， SU ， r )< Llg (“ + ”）」< 

Llg 2 max ( w ， T ；)」 = l + Ug max ( u ， tO 」。 

注意 S (u ? v ) = S ( w ， w )。 如果 w 为偶， S ( u ， v ) = S ( w /2， f ); 因此我们可以假 
定以和！；为奇。我们还可以假定因为 S ( W ，^) = 1。 于是由归纳法， SU ， T ；) = 
1+ S((u - v ) l 2 , v)^：l + lg ( ( w - v 、 l 2+ v ) 二 lg(w + w )。 

顺便指出，由此得出，要求 《 个减法步骤的最小情况是 WI 21 1 + 1，^=2” _1 _ 

lo 

38. 记住操作数的最高有效字和最低有效字（最高有效字用来猜测〖的符号，而 
最低有效字用来确定右移的数量），同时构造单精度整数的一个 2 X 2 矩阵 A ，使得 

a ( U ) = 其中… 是计算机字长而/和^比 w 和 t / 小。（代替用2除被模拟 

\v I \v IV I 

的奇操作数，我们用2来乘另一个操作数，直到在恰好 lg w 次移位后得到 W 的倍数 
为止。）实验证明，至少在一台计算机上，这个算法的运行速度比算法 L 快3倍。使 

用习题40的一个类似的算法，我们不需要最高有效字。 

J . Sorenson , J . Algorithms 16 ( 1994 ) ，110〜144; ^lallit 和 Sorenson , Lecture 

Notes in Comp . Sci . 877(1994) ， 169 〜 183 ，已经描述了一个可能更快的二进制算法。 

39. (Michael Penk 给岀的解。） 

Y1 •[求2的幂]和步骤 B 1 相同。 

Y2 •[初始化] — — — 如果 

• 620 - 



4.5.2 小节 


U 是奇数，则置 （q，h,《 3 ) — (0, - 1， - I；)并转到 Y4。 否则 

(1，0，"W)。 

Y3. [ t 3 折半]如果 q 和都是偶数，则置 （q ，〖2，〖3)—(〗1，〖2,(3)/2;否则置 

( tiyt 2 , ti + V , t 2 - u , ,3)/2。 （在后一情况下， Q + I； 和 - W 都将 

为偶数。） 

Y 4 为偶数？]如果 r 3 为偶数，则转回 Y3。 

Y5 •[恢复 maxU 3 ,x； 3 )] 如果纟 3 为正，则置 W ，心 ）—（hQ ，纟 3 );否则置 

{ v { y V 2 yV 2> )^(v ~ t X , - U - t 2 > - ， 3 )。 

Y 6 •[减 ] 置 （h “2， z 3 ) —( ， W 2 ， W3) - ( ，幻2，幻3)。然后若，则置 （q 山) 

—(q + U 2 - w )。 若则转回丫3，否则算法终止且（^， 2 ,心.2*) 
作为输出 D I 

显然， （16) 中的关系被保持，而且在执行步骤 Y2 〜 Y6 中的每一步后 0< Wl ， 

*^1 ， 1 ， {y^-Ui y X>2 •) t2^ ~ U ^ 0<C W 3 ^ W ，0< V^^：V O 如果在执行步骤 Y2 后， W 

为奇数，则步骤 Y3 可被简化，因为 Q 和/ 2 都为偶数当且仅当 o 为 偶数; 类似地，如 

果^为奇数，则 h 和 h 都为偶数当且仅当巧为偶数。于是，如同在算法X中那 

样，假定在执行步骤 Y2 之后 t； 为奇数，则有可能取消涉及 W2 ,t ； 2 和的所有计 

算。这个条件通常是预先知道的（例如，当 i 为素数且我们试图计算^- 1 modulo t； 
时 ）。 

关于习题40中算法的一个类似的扩充，也请参见 A.W.Bojanczyk 和 R. P. 
Brent f Computers and Math . 14 (1987) ,233。 

40 .令 m = lg max( I w I ， | t; | ) 。在执行了步骤 K3 中的操作 c — c + 1 5次之后， 

我们可归纳地证明 M<2 W —( 5 〃) /2 ，| t ；|<2 w -(~) /2 。 因此 s <2 ttz 。 如果 K2 被执 

t 次，我们有 + 因为除了头 一 ■次和最后 一 次外， s 每次都增加。[参见 VT- 
SI ’83 ( North-Holland , 1983) , 145 〜 154。 ] 

注：当 w = l 和 v = 3*2 k ~ 1 以及焱>2时，我们有 w 二 々+2，s=2々，z = 々+ 4。 

当在由 u 0 = 3 f u { = I, Uj + { = min( I — 16〜 _ i I ， | -I 64 q | ) 定义的序列中 w 

=〜 和 w = 2 士 —〗时，我们有5 = 2；+2,^2；+3以及（经验地）〖可以渐近 
地大于 2 ml 0吗？ 

41 ■一 般地说，由于 -1) mod ( a v ~ l ) = a u mod 。 - 1( 参见等式4 . 3 .2-(20)) ， 

对于所有正整数 a ，我们求得 gcd(a^ - 1，〆 -1) 二 ^ gcdU>r ,) - l 0 

42•对于々=1，2,3，一从第 Ik ^ kAk 等列，减去第々列。结果是 a 在々列的 
对角线上的一个三角矩阵，其中 m \ 由此得出，:?:；„ =〆7/2 ) ,所以行列式 

是 ( p ⑴ < p ⑵… < p ( n ) o 

[通常， “Smith 行列式”，其中对于一个任意的函数/，元素0， ； ）是 /(g C d( Z , 
i )) » 由相同的论证，等于 11二 〗 \ (mj d ) f ( d ) 0 参见 L.E. Dickson , His tory of 
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the Theory o / Numbers 1 (Carnegie Inst , of Washington ，1919) ， 122 〜123。 _ 


4.5.3 小节 


1 .运行时间大约是 19. 02了+ 6,仅仅比程序 4.5.2 A 慢 


点 


o 


2 . 




工 „ — t ，心 


K 


n - 1 \ ^ 2 


j w 一 i ， 00 Yi 


K^-yixj ， : t ： 2, … ，工 1 
K v — 2 ^ ^ 2 ^ ，工， ? - 1 


o 


3. v x \ 


，工 "） 


o 


由归纳法，或者取习题 2 中矩阵乘积的行列式。 


当诸 x 为正时， （9) 中诸 Q 也为正，且 


+ 


> Q 


YX 


因此 （9) 是递减项的交错 


级数，而且它收敛当且仅当 q n q . 


1 


o 


由归纳法，如果诸: T 大于我们有 q n Xl 



其中 C 选成足够小使得对于 


和2,这个不等式成立。但如果 X 


71 


II 


2' 我们有〜<2-1/2”。 

6. 只须证明而且每当〜，•••，；为正整数时，0<//々，…，；//<1， 
由此事实我们有 BfLl/Xh A ,。 

7. 仅有12… n 和77…21。（变量 A 恰在 fy ^ + 1 _ ^项中 出现； 因此 A 和 A 仅 
可排列成:和： c 7 , 。如果：^和： T „ 都为这个排列所固定，则由归纳法得出工 2 ,…， 


也是固定的。) 

8.这等价于 


K n _ 2 ( A „_] ,*•* , A 2 ) - XK 77 ^ [ ( A „- 


1 


參 _ * 


，A 


UA ”，〜， A 2 ) — XK v ( A n y 


參寥 # 


，A 


X 


n 


而且由 （6) 这等价于 

_ — ! ( A 2 ，…， A ”）+ H 一 2 ( A 2 ，…， A ” —!) 

X = KjA . r-.Aj + H — iUi ，…， A ”—!） 

9. a ) 由定义。 b )， d ) 先给出对于 a = 1 的证明，然后应用 a ) 得到对于一般”的 

结果。 c ) 当 n = k + 1 时，证明之，然后应用 a )。 

10. 如果 A 0 >0, 则 = 0,4 = A 0 ， B 2 二 Ai ， B 3 = A 2 ， B 4 = A 3 ， B 5 = A 4 , m = 

5。如果 A 0 = 0, 则 B 。 二 如果 Ao =— 1，且 

A ^ l ， 则 B 0 = — ( A 2 + 2), B ! = 1, B 2 - A 3 - 1 y B 3 = A 4 9 m = 3。如果 A 。： - 1 且 
Ai >1 ，则 B 。= - 2 , = 1, B 2 = A 2 ~ 2 , B 3 = A 2i B 4 = A 3 , B 5 = A 4y m = 5 0 如果 

A 0 < -1， 则 B 0 = -1 7 E 1 = 1, E 2 = - A 0 -2, E 3 = 1, B 4 = A ! - 1, B 5 = A 2 , J 3 6 = A 3 , 
5 7 二 A 4 ，m = 7。[实际上，最后三种情况包含八种子情况；只要诸 B 中有一个被置 

为0,则利用习题 9 c ) 的规则可知，这些值应该“一起消失”。例如，如果 A g = -1, A ! 
= A 3 = 1， 则我们实际上有 Bq ~ — + + 仍=1。当 A 0 = 一 2， A [ = 

1时，产生双重消失。] 
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11‘设 w ，…， A ”） ， g : = 坟（仏 ，… ，氏），九 = U A 。 ，…， A J ， /): 

UB 0 , …， BJ 0 由 （5) 和 （11) 我们有 X =( p n} + p m - l X m ) Kq m + q m - x X ni ). 

Y=(K + YJ ; 因此，如果 = I ，则由 （8 )，X 和 Y 之间的 

上述关系成立。反之，如果 X = ( gY + r ) l ( sY + Z ) ，且 I % _ rs I = 1 ，则我们可以假 
定5>0,而且我们可以对 s 用归纳法证明 X 和 Y 的部分商终将一致。由习题 9( d ) ， 
当 s = 0 时，这结果显然。如果 s >0,设 g =似+ /，其中0</ < 5,则 X = a + 1/ 

((sY + 0/( + r — 加））；由于 s(r - at ) - ts ' — sr - ⑺，且 /〈 s ， 由归纳法和习题 

10,我们知道 X 和 Y 的部分商终将一致。 { J.de Math . Pures et Appl - 15 (1850),153 
〜 155。通过对这个证明更仔细的检查，习题10中 m 总为奇数这个事实表明， 

= Y , 当且仅当叉=( 9 7十广）/( 5 7+0，其中 qt ~ 

12. a ) 由于 V n V n + l ^ D ~ 1/ 2 „，我们知道 D - 1^ + 1 是％ + 1 的 倍数； 因此由归 

纳法 ，& = (/万_ %)/\/„，其中 U n , 为整数。 [注： 基于这一过程的一个算法对 

于整数的二次方程求解有许多 应用。比如说 ，参见 H . Davenport , The Higher Arith ¬ 
metic ( London ： Hutchinson , 1952); W . J . LeVeque,Topics in Number Theory ( Read ¬ 
ing , Mass .： Addison-Wesley ,1956) ;也 可参见 4.5.4 小节。由习题1.2.4-35, 当 + l 

>0时我们有 A „ + l = L(LL VDJ + LU/U 当 V … <0时 A „ + i = L ( Lv ^」+ 1 

+ R)/K + 1 」 ； 因此这样一个算法只须对正整数 L #」 来工作。而且当 ％ +1 正被 
确定时，恒等式 V n + ] = A n ( U n ^~ L / J + 使得没有必要来做除法。] 

b ) 设 y =( — /万 - L ；)/\/， — — R )/\/ 7 ,。 在 a ) 的证明中用 -41) 

代替 VS ， 所述的恒等式显然成立。我们有 

y = + P „-^ l(QnlYn + Qn -[) 

其中和 L 在本题 c ) 中定义，因此 

= (- qj qn-\)(Y - p v lq n ) l ( Y - Pn -\\ 9^-1 ) 

但由 （12) ，九 ^/〜叫和 pjq n 都极其接近于 X ; 因为 X # Y ， 对于所有大的 n，Y _ 
久/〜和 Y - 久^/〜心将有与 Y - X 相同的符号。这证明，对于所有大的 n , Y , < 

0;因此0<&<^ - Y „=2 v r D / V ,; 必为正。而且1/ 〆 /^，因为&>0。因 

此％ <2#，因为 

最后我们要来证明 U n >0 Q 由于尤<1 ，我们有匕，所以我们只须 

考虑 万的情况。于是 u n = A „ V „ - - U n . { >/D - R - i ，而且 

如同我们已经观察过的那样，它是正的。 

注:在 重复循环中，# + L 7„ = + (/D - (^叫）> 八；因此 L (# + 

U >I + l ) IV t] + l ] = lA n + { + V „/(/ D + L 7 JJ = A „ + 1 = L (/ D + Uj / V n + l ] 0 换言之， 

由1^ + 1 和 八 + 1 确定； 我们在这个周期中可以由 （ R ， 八） 的后继（。 + 1 ， 
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K + 1 )确定（[；„，％ )。事实上，当0< + L 7„ 和0< [；，,</万时，上述论证 

证明0< + + |^ + 1 和0< [；„ + 1 </乃 ； 而且，如果数偶（1/ 71 + 1 ，\^ + 1 )跟在 

(LT ，\0之后且0< \^<# + LT 和0< LT</^， 则 LT = 和 V 7 = V „。 因此 


( U }} , V n ) 是循环的一部分当且仅当0 < V ,, < # +汄和0 < R < /万。 






( Q n X - p n )( q n Y - p n ) 

(Qn-\^ ~ Pn~\)(Qn-i^ ~ Pn~i) 


也有一个伴随的恒等式，即 

Vp,pn-1 + U(p n q n -1 + P,-iQj 十（（卩 2 — D)IV)q n q n _ 1 = (- \YU n 

d ) 对于某个 n # 奶，如果，贝 U X 是满足二次方程九 "（LyX 

~ p t] - { ) = ( q m X _ p m 、 l ( q m -\X _ p m - 0 的一个无理数。 

奠定本习题基础的思想至少可回溯到公元1073年之前在印度的 Jayadeva ; 参 
见 K . S . Shukla,Ganita 5(1954) ，1 〜20; C . _0 Seieni us , His for!.a Math . 2 (1975 )，167 
〜184。在 1750 年之前，在日本也发现了它的某些方面，请见 Y . Mikami,The Devel ¬ 
opment of Mathematics in China and Japan (1913) ， 223 〜229。但是关于二次式连分 
数理论的重要原理大部分归功于欧拉 [ Novi . Comment Acad . Sci . Petrop 11( 1765) , 
28 〜 66] 以及拉格朗日 [ Mst . Acd.Sd .24 ( Berlin : 1768) ， 111 〜 180] 。 

14 . 像在习题 9 中一样，我们只须当 c 是最后的部分商时验证所述的恒等式，而 
这个验证是很简单的。现在 Hurwitz 的规则给出 2 / e = //1 ， 2 ， 1 ， 2，0 ， 1 ， 1 ， 1 ， 1，1 ， 0 ， 
2 , 3 , 2 , 0 ， 1 ， 1 ， 3 ， 1 ， 1 ， 0 , 2 , 5 ，一//。取倒数，像在习题 9 中那样把零都除去，并且注 

意出现的模式，我们发现（参考习题 16 ) e /2 = 1 + // 2 , 2 m + l , 3 , 1,2772 + 1 , 1 , 3 //, 

m^Oo [Schriften der phys . - okon . Gesellschaft zu Konigsberg 32 ( 1891 ) ， 59 〜 62 0 
Hurwitz ^^Vierteljahrsschrift der Naturforschenden Gesellschaft in Zurich 41 

( 1896 ) Jubelband II , 34 - 64 , § 2 中说明怎样以一个任意的正整数来乘。] 

15 . ( 这一过程利用四个整数 （ A ， B ， C ， D )， 它的意义恒为“我们剩下的工作是 
输出 （Ajy + B)/(Cy + D ) 的连分数，其中： y 是有待输入的数”。）开始时置 j — k — 0 , 
( A ， B ， C ， D ) — ( a ， 6 ， c ， d ); 然后输人： r ; 并置 （ A ， B ， C ， D ) — ( Ax ) + J 3 , A , Cx } + 

D ， C )， j —+ 1 — 次或多次直到 C + D 的符号和 C 相同。（当且输入未结束 
时，我们知道 1 < 3 ,〈⑺；因此当 C + D 的符号和 C 相同时，我们知道 （ Ay + B)/(Qy 
+ 1 ))位于（焱+ 6 )/((： +乃）和 AIC 之间。）一般的步骤 是：如 果没有整数严格地位 
于 （ A + B)/(C 十 D ) 和 AIC 之间，则输出 X ,- min ( LA / Cj , L(A + B)/(C + D ) J ), 

并且置 （ A ， jB ， C ， D ) — ( C ， D，A - X , C , B - X k D、，k — k + 1 ; 否则输入气并置 （ A , 

B , C , D)^~( Axj + B , A , Cxj + D , C ) ， j —j + 1 。无限地重复这个 一 般步骤。然而， 

一旦最后的~被输入，则算法立即改换动 作：利 用欧几里得算法输岀 （ A & + B )/ 

( Cz , + D ) 的连分数，并终止。 

下列表格解决所要求的例子的问题，其中矩阵在左上角开始，然后输 
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人时右移一位，输出时降一位: 



M . Mendes France 已经证明：相对于每个商输入的商输出个数渐近地界于1/ r * 和 r 
之间，其中 r = 2 LL (| ad -&|)/2」+ l ， aL 是习题38中定义的 函数； 这个界是最 

好的 。 [Topics in Number Theory , P . Turan 编， Colloquia Math . Soc . Janos Bolyai 13 

(1976),183 〜 194。] 


Gosper 还证明了上述算法可以推广来从 2 和^的连分数计算 



bx + cy 



d)l (Axy + Bx + C3 / + D ) 的连分数（特别是计算和与积 。） [MIT AI Laboratory 
Memo 239(29,1972 年2月29日 ) , Hack 101。] 


16.用归纳法不难证明 f n ( z ) 




zl (2 n + 1) + 0( z 3 ) 是 




个在原点的一个邻域 


中有一个收敛的幂级数的奇函数，而且它满足给定的微分方程。因此 


/ o ( 之） 


// 


2： 


-1 



fi(z) // 


// 


Z 


一 1 





-1 


剩下的是要证明 lim 


// 


Z 


- 1 


,3 z 


一 1 


， (2 n + l)z 


一 1 


，(2 

//: 


n 



l ) 


z 


-1 



fn 


+ 1 


z 


)// 


/ o ( 


z 


[实际上，欧拉在 


24 岁时，就获得了对于更为一般得多的微分方程 f n ( z ) = az m + bf n { z ) z m ~ l + 

c /„ U ) 2 的连分数展开，但他没有费心去证明收敛性，因为在18世纪时能有形式处 
理和这样的直觉就已很了不起了。] 

有好几种方法可证明所要求的极限等式。首先，命 /„ U ) = 我们可以 

从等式 

( 2 n + l ) a n i + ( 2 n + 3 ) a n ^ z 2 + ( 2 n + 5) a „5 之 4 + …= 

1 _ ( a nX z + a n 3 z 3 + a nS z s + …) 2 

论断 （ _ + 是形如 c kl (^ n +1广 l ( 2 n + +〜）的项之和，其中 q 和心 w 

都是同 n 无关的正整数。例如，我们有- a nl = 4 l ( 2 n + l ) 4 (2 n + 3)(2” + 5 )( 2 n + 7) + 

1/(2” + 1) 4 (2”.十3) 2 (2"+7)。于是|^十以|<|〜|，而且对于|之|〈兀/2，|/ 71 (之）|< 

tanklo AU ) 的这个一致的上限使得收敛性的证明非常简单。仔细研究这个论证即可 


发现，对于|2|<7^272十1/2，/,(^)的幂级数实际上收敛;因此当72增大时/„(2)的奇异 
性越来越远离原点，所以在整个复平面上，这个连分数实际上表示 tanh 〜 
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另一个证明给出一种不同类型的进一步信息 ：如果 我们命 


n 


A n (z) 


n 




2n - k 


z 


n 


k\ 



n 



k )\ 


z 


n — k 


k^O 


\{n - k)\ 



n ! 2 :^ 2 F 0 (n 



1， - n.. - 1/ 


2： 


则 


A 




)=E 


n 


+ 是 一 1)! ((4n + 2)k + 


n 



k>0 


kl(n 



1-k) 


l - k)(?i - k)) ” + i — 

z 


(4 n + 2)A n {z) + z 2 A n - X {z 


用 归纳法 ，由 此得出 


K 



2n — 1\ 


n l ， ， 

2 ： Z 


Z 


A n (2z) + A n ( - 2z 


2 




K 


n - \ 



2n — 1 


(2 z ) — A n ( - 2z 


Z 


z 





因此 





- l)z~ l // 


A n {2z) - A n {~ 2z 


A n (2 


z 


+ A ”（ _ 2 


z 


我们来证明这个比例趋近于 tanh Zo 由等式 1.2.9-(11) 和1么6_(24)知 


( - z) 


nlj ： 

rn ^0 




Z 


m 


2 


m 


o 


\k 


2n — k\ 


一 1) 


k 


n 


m ^0 


12 


n 


m 


z 


m 


n 


n I 

ml 


因此 


e 之 A ”( - z) 


AJ 


Z 


K ( 


z 


- l) w 


2r? + l 


Z 



n 



k )\ 


z 


k >0 


(2 n 



k 



1)U! 


我们现在有 （e z - 1) ( A n (2z) + A r; ( — 2之）） - (e z + 1) (A n (2z) - A n ( - 2z)) 
2 i ^(2 z ); 因此 


tanh 


2 ； 


-H 


Z 


一 1 1 



，…， （2 n - l)z~ r // 


2R n (2z) 


d (2z) + ( 


2z))(e 


z 



1 ) 


于是我们对于差有一个精确的公式。当 |2 z |< l 时，因子 e h + l 与0的距离有界 


R n (2z) I n\ I(2n 



1)! ，而且 




A n {2z) + A n (- 





(2n - 4 、 
\ n / 



(2n)\L _丄_丄_丄 2_ (2 n )! 

n ! I 1 4 16 64 ~ *** j _ 3 n ! 

于是，甚至对于 z 的复值，收敛仍是非常快的。 

为了从这个连分数转到 e " 的连分数，我们有 tanh z = 1 - 2/(# + 1 ) ;因此，通 

过简单的运算我们得到 （ e 2z + 1 )/2 的连分数表示。 Hurwitz 规则给出了 e 2z + 1的展 
开式，由之我们可以减1。对于 n 为奇数， 
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e 2 /n — n mn H -[ n /2 J , (12 m + 6) rz , (3 m + 2) n + L ^/2 j , 1 // , m ^ 0 

另一个推导已由 C . S . Davis 给出，见 J ‘ London Math . Soc . 20 (1945 )，194 〜198。 
e 的连分数首先是由 Roger Cotzs 凭经验找出的， Philosophical Transactions 29 
(1714),5-45 ,Proposition 1 ,Scholium 3 o 欧拉于 1731 年 11 月 25 日写信给哥德巴 

赫介绍了他的结果 [ P . H . Fuss 编， Co / responc/ance Mathematique et Physique , 1( St . 
Petersburg ： 1843) ， 56 〜 60 ] ，而且最终他在 Com men fa Wi Acad . Sci . Petropolitansse 9 

(1737)，98〜137;11 (1739),32-81 上发表了更完全的描述。 

17.( b )//： r 1 - l ， l ，: c 2 _ 2， l ，: c 3 -2， l ，".， l ，： r 2 „ — 1 - 2， l ，: c 2；2 - l //。 [注：使用 

恒等式 


K 


)71 


+ 


n 




X 


m y 


n 


♦ » # 


，: yi ) 


ir 


i 


K 


m 2 


(: r ! ， • 


X 


m 


L , 0C m 一 1 ， 1 ，工 


1 


1 


》1) 


可以从连分数删去负参数，两次应用该式后我们得到 


K 


m + 


f 蠡•蠡 

，2 + 1、丄1， ，丄 


m 






- + ，•** - 1 ， 1 ， 工 ~ 2, \,y n - 1,^-1 . *** >y\) 

一 个类似的恒等式岀现于习题41中。] 

( c ) 1+ II W、H = 1 + //2 m + 1,1//, m ^0 o 

18. 由于由等式 （5) 和 （8)， 我们有 iC w ( a ] ，<2 2 ，…， a w ) // …、 a m 、工 // 二 

K m - i ( a 2 ，… “ i m ) + ( _ l) w / ( K m _ 1 ( a L , •** , a m _ x ) + K m ( q ， a 2 ，…， ) 工 ） ，我们也 
有 K m (a x y a 2 y -' y a m ) // a { y a 2 , y a m , x { , a x , a 2 y , a m , x 2 , , a 2 , y a m , x 3 y 

ai ,•*■// = K m 一【 （ a 2 ，…， a w ) + // (- 1) m ( C + Ax ! ) , C + Ax 2 ， （ - 1) ,,? ( C + Ax z ) , 

… , 其中 A = ( a ] ， a 2 , …， a 爪）和 C = Ua 2 , … ， a m ) + q ，…， 

a m - i ) o 结果由 （6)， 所述的差是 （ i ( a 2 ，…， a m ) _ K 7n — i ( a [f *** , a m - v ))/ 
K m (ai ， a 2 ，…， a m ) 。 [ ?72 = 2 的情况是由欧拉在 Cammentar / i ’ Acad . Sci . 

Petropolitanae 9 (1737) ,98 〜 137 ， §24 〜 26 上讨论的。] 

19. 对于 1<々< N ， 这个和是 log 6 ((l + : r)(N + l)/(/V + l + ： c ))。 

20. 设 H = SG ，^ ■(: r ) = (l + WG ’ U)，A U ) = (l + : c ) fr (： c )。 则 （37) 意味着 

A (x + 1 )/( 工 + 2) - h(x) I (x + 1) = _ (1 + x) ~ 2 g(ll(l + x))l(l + 1/(1 + i ))。 

21. ( p ( x ) = cl (cx + 1 ) 2 + (2 - c)l ((c ~ 1) x + 1 ) 2 , U(p (: r ) = l/(:r + c ) 2 。 当(: 

<1 时，在 ： r = 0 处出现的极小值，该值为2彡<2。当 €></> 时，在 ： T 
=1处出现极小值，该值小于等于4 2 。当 C 〜 1.31266 时，在 x =0 和： c = l 处的值 
接近于相等且极小值大于3.2;得到界（0.29)><^/><(0.31)>。由精心选定的 
线性组合 Tg(x) = 'Za J Kx + c 7 ) 可得到更好的界。 

23.对于 x 0 = 0, x ! = x , x 2 = x + 6 ， 并令6—0,通过习题 4.6.4-15 的内插公式， 

我们有一般的恒等式如下，每当是具有连续的二阶导数的函数时，对于0和 ： r 


之间的某心 （ x )， i^(：O = (/ U ： r )- iU 0 ))/:r + |:^:(& U ))。 因此在这种情况 
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T , R ：( x ) = 0(2 


24. 


。 [ A . Khinchin 在 Compos , Math . 1 (1935)，361 〜 382 证明 了对几乎所有 

的实数 X , X 的头 n 个部分商之和 Ai + … + A „ 渐近地趋于 nig n 。 习题35表明对 

. 1 

于有理数 X ，这个特性是不同的。] 


25 .任何一组区间的并都可以写成一些不相交区间的并，因为我们有 Uo：l 


k 



k^l 


(I 


k 



W 1 




，而这是一个不相交的并，其中 h \ U K ; < J ; 可以表达成不 


相交区间的有限的并。因此，利用有理数的某种枚举方法，我们可以取4= U 4, 其 
中 h 是包含[0，1]中的第々个有理数的长度为的一个区间。在这种情况下， 

但对于所有的 rz ， 


n 


26.出现的连分数 // A : ，…， A , //恰巧是使得 Ai >1， A , >1的那些，而且 


KAA . ,A 


A ,) 是72的一个因子。因此 （6) 完成了这个证明。 


如果 771\1 n 


// A ,, 


i • « 


, A Z // 而且 m 2 ln = // A z ，…， Ai //， 其中 和 同 n 互素，则 771^2 


±1 (modulo n ); 这个规则确定了对应关系。当 A : = l 时，按照（46)，类似的对称性 
成立。 

27. 首先 对于” =，，然后对于 n = rs 证明这个结果，其中 r 和 5 互素。 或者， 
使用下题中的公式。 

28. a ) 左边是乘法性的（见习题 1.2.4-31), 而且当 7 z 是一个素数的幂时，容易 


计算它。 c ) 从 a ) ，我们有 M 6 bius 的逆公式 ：如果 /( 




A 


g d ) ，则 g (^) 




^d\nM 


n 


/ d ) f ( d ) 


O 


由欧拉求和公式（见习题 1.2.11.2-7)， 我们有 S n N =1 n In n = 



2 


N 


N 


0( N 2 )， 也有 S 


N 


n 


s 


d \ 


n A ( d)/d 




N 

d = 1 


八⑻ 2 


Kk<Nid 



，而这是 OCZ ^ A ( d ). 


N 2 / d 2 ) 二 0( N 2 )。 事实上， _ f (2)/?(2)。 

30 .当且仅当在未修改的算法中随后的除法步骤中的商为 1 时，修正后的算法 
将影响这个计算，在这种情况下它避免了随后的除法步骤。避免掉一个给定的除法 
步骤的概率，相当于 A & = 1且这个商前边有偶数个商等于1的概率。由对称性条 

件，这是而且它 后边有 偶数个商等于1的概率。当且仅当 


0.618 … ，后 一 情况才出现，其中士是黄金比：因为= 1, + ! > 1当且仅当 


2 







A 


k 


^k + 2~ 




k + 3 > l 当且仅当 


2 



等等。因此我们 


日 


差不多节省了除法步骤的 -1)^1 -lg ^0.306 o 当 

同 tz 互素时，平均的步骤数近似于 （ U 2 In ^) ln 2 )\ nn 0 

K . Vahlen[CrelIe 115 (1895)，221 〜 233] 考虑了当 w mod 时在每次迭代中 

以 （ t ； , ( ± w ) mod u ) 替代 （ w , u ) 的所有算法。如果 w 丄 u ， 恰好有 i 个这样的算法， 

r 个叶的一个二叉树。在所有这样的 gcd 算法中，对应于最 
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短可能的迭代次数的最浅的叶，在每步中取最小剩余时 出现； 而当总是选择最大的 
剩余时，出现最深的叶。 [^ JHist . Acad . Sci . 23 ( Berlin : 1768) ， 111 〜180，§58中拉 

格朗日考虑了类似的思想。]关于进一步的结果，请见 N . G.de Bnnjri 和 W . M . 

Zaring ,iVieuw Archief voor Wiskunde (3) 1 (1953) ， 105 〜 112; G. J . Rieger , Math . 

Nachr . 82 (1978) ， 157 〜 180。 

在许多计算机上，修改过的算法使得每个除法步骤 更长； 习题 1 的思想是当商 
为1时，它节 省所有 的除法步骤。在这样一些情况下，它将是可取的。 


31•设 ao ~0 ,ai = + ^ + ari ; 则〜 = (( 1 + V 2 ~~ (1 — \/2 )^)/2 \[2 , 


而且当 


/2>2 时，出现最坏的情况（在定理 F 的意义下）。这 


结果由 A.DupK 给出 L /. c/e Math . 11 (1846) ，41 〜 64] ，他还研究了由 J.Binet 提出 
的更为一般的“向前看”的过程。 

32. ( b ) K m _ 1 ( x x , , x m - x ) K n - v { x m+2 y ***» w ) 对应于长度为 


m 



n 


的 


Morse 代码序列，其中一个长划占有位置 772 和 


m 



1;其它的项对应相反的情况。 


(或者，使用习题2。在欧拉的论文中，也出现有更为一般的恒等式 K 


m 


n(^l^ 


x m ^ n ) K k ( x m ^ ly -^ X 


m 


K 


m ^ k 


( oc x ， 


i » » 


， X m + k 


) K n 


X 


m 


1 


驗參瞻 

y + 




(- 1 ) 


Km - 1 ( ^ 1 y y 工 m — 1 ) 尺” 一是一 1 ^m + 厶 + 2 ， ■ • • ，工 w + 乃 


o 


33 . a ) 新的表不是对于^~?2<772<72，：1： = 772/^/，3^=(72 — 772)/(^，：?： /= 3； /： =3 = 

gcd ( m y n - m ) o b ) 关系 （72/工） - 3^<：^<71/工确定2。 c ) 计算满足 b ) 的： r '。 d ) 
一 对整数 ： c 〉： y 〉0 且 工丄 ： y 可惟一地写成 :c = K 7/l (x { } '•' , x m ) y y = K nl _ ) ( xi , 4 4 4 , 

Jm - i ) 的形式，其中工这里，…，： Ti //。 e ) 只需证明 

^ 71 ) ~ 2 L ti /2 J + A (；2); 这由习题26得出。 

34 . a ) 以 gcd( : r , )) 除工和: y 得到 g 应用习题 28 c ) ,并使用 

素数和非素数变量之间的对称性。 b ) 对于固定的^和“使得的表示有 


因此有 0(7^5/： y ) 种这样的表示。现在对求和 


o 


C 


)如 


果 djO 是给定的和，则比如说2 


d\ 


y 


s 


( d ) 




y 


( H 2 y - H y ) 


々（ 3 ；); 因此 s ( y ) 


^d \ y^^yl ° 现在々（: y ) = y In 2 - + 0(1/ y ) o d ) < p ( y ) ly 2 = 2^ = j [ d \ 


y ] fj .( d)!yd = Yj cd<n n ( d ) lcd 2 o (类似地， 2“ 丄 cr - i (: y )/： y 2 = O (1) 。 ） e ) 

(々）/左 2 = 6/兀 2 十0(1/72)(见习题4.5.2-1001)) ; 而且2“ 1 /^(0化々/々 2 =0(1)。因 

此对于 d^l 我们有 h d ( n ) = n ((3 In 2)/7^) in ( n / d ) + O ( n ) 。最后 h ( n ) -2 


cd \ ^ ^ 

的和是 2 = 
[众所周知 




((6 In 2/ tc 2 ) n (In — S ) + 0( 


no 


- 1 


n ) 


2 


其中剩下 


E 


G 


cd \ 


— 1 (/ 2 ) 


n f £( d )[ n ( cd)lcd = 0 和 2 


s 


cd \ 


n ju ( d)\n cl cd = 2 rf \ n A(d )1 d 


O 




0( log log 


参看 Hardy 和 Wright，An Introduction to the 


Theory of Numbers ， §22.9 


O 
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35 - jALProc . Nat . Acad . Sci . 72 (1975) ， 4720 〜4722 。 IVL L ‘ V . Pitteway 和 C . ML 
A . Castla [ Buii . Inst . Math , and its Applications 24 (1988) ， 17 〜 20] 已经发现很强和吸 

引人的经验证据，即所有部分商之和实际上是 




T 


n 



18(ln2) 2 

TT 2 




7 T 2 



/>素 

p \ n 


/ 4 r 

\ p r 


2.542875 + 0(, 


- 1/2 


36. 向后执行算法，并假定对于一个给 定的々 值，4 _ 1 个除法在步骤中出 


现，当 gcd ( w ⑷，…， tO 


F t 


参參 ■ 


F t . 和以戸 F 


參參 ■ 


F 


F 


a (modulo gcd (从 “ 1 ，…， 


以„))时，我们得到极小值〜•，这里诸 山 >3,以及~ +…+ ^-^ N + n-lo 
在这些条件下极小化 u n = F t … F , 的一个方法是取 h = 3，〖 2 ^" = ~- 2 = 2，、= 

\ n - 1 

2 F N i + 2d 如果我们还假设 〜， 则解 u r - 2 F n _„ + 3 + 1， w 2 二…= 

' — P 2 FN - H 3, 〜=2心_„ +2 有极小的 [参见 CACM 13 (1970) ，433〜436， 

447 - 448 0 ] 

37 . EProc Amer . Math . Soc . 1 (1956) ， 1014 〜 1021; 也请参见习题6.1-18。 

38. 设 m = T W 今1，使得 —i + …//，其中 0<6<l/n o 设々 

是使得〜 >2的极 小值; 则（V」+ ( - l ) k F k .^) Kr k ~( ~ 1”PV )>2, 因此々为偶 


数而 < T 2 = 2—今 + =(令 2 “ 2 - — 2 WM 。 [ Ann . Polon . Math . 1 (1954),203- 


206 0 ] 

39 .至少 287 是轮上 了的； //2，1,95 // = 96/28733449477,没有分母 < 287的 
分数位于区间 

: • 3335， . 3345] = [//2,1,666//，//2，1，94，1，1，3//] 

巾0 

为了解决求具有最小分母的 U ，6] (其中 0< a <6< l ) 中分数的一般问题，注 
意借助于正则连分数表示我们有 // A 32,……当且仅当对于满足 
Xj =7^ y } 的最小的 j ， （- 1)^ < ( _ 1 ) J yj ,其中我们把“ 00 ”放在 一 个有理数的最后的 

部分商之后。因此如果 a = //:^， x 2 ，…//且6 = //%，: y 2 ，…//，且 ■； 是使 A #% 之 
极小者，贝，6]中的分数有 c =//:^，…，: — i ，巧 ，…， z m // 的形式，其中// 4，…， 
z m // 位于// + 〖，…//和//% ，％ + i ，…//之间。设 K — ! = 0， c 的分母 

尺广丄 （ h ，…，： C 广 i 1 ( Zj ，…， ) 十 K 广 2( 工1，…，工广 2) K W - 〆 勺+ 1，…，之爪 ） 

当 m = j 和$ = ( j 奇+ [ yj + °°~\ y x j + [七十1 _ 00 ]) 时取极小值。[推导这一^ 

方法的另一个途径由下边习题的理论得出。] 

40.用归纳法可以证明，在每一节点处因此 A 和①互素。由于 

plq < p ' lq ' 惫昧着 plq<(p + 〆 )/( Q + 〆 ）<// 〆 ，显然 W 9的所有左后裔上的标 
号小于 p / g ， 而所有右后裔上的标号大于 plq 。 因此每个有理数作为一个标号至多 


« 
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出现 一 ^次。 

剩下的是证明每个有理数确实出现。如果= ，…，〜，1//,其中每个〜 

是正整数，用归纳法可以证明标号为的节点可通过往左走 q 次，然后往右 a 2 
次，然后左走 a 3 次等等而被找到。 

[这个树的逐级标号序列首先是由 M . A . Stern 研究的， Cre〗ie 55(1858) 193〜 
220,尽管在他的论文中未明显地给出与二叉树的关系。通过逐次地在相邻元素户/ 
g 和 〆 之间插入（/> +，）/((? + 〆 ）而得到所有可能的分数的思想可以回溯得久 

远得多：实质性的思想是由 Daniel Schwenter [ Delicide Physico-Mathematicas 
( Niirnberg : 1636) , Part 1, Problem 87 ;Geometria Practica ，第 3 版 （1641) ， 68; 参见 
M . Cantor yGeschichte der Math . 2 (1900) ， 763 〜 765 ] ，以及由 John Wallis 在他的 
Treatise of Algebra (1685) ，第 10 〜 11 章给出的。 C . Huygens 在设计他的天象仪的齿 
轮时很好地利用了这样一些思想[参见他死后才发表的 DescWptio Automati Plane - 
tahi (1703)]。 拉格朗日在 ffist , Aca.Sd 23( Berlin :1767)，311 〜352, §24 以及在他 

对欧拉的代数学的法文版的补充（1774)，§18 〜 §20中给出了充分的描述。也请 
参见习题 1 • 3 .2 - 19; A . Brocot , i^evue Chronometrique 3 (1861) ， 186 〜 194; D . H . 
Lehmer,AMM 36 (1929) ,59 〜 67。] 

41 .事实上，对于一般形式的数 



的正则连分数有一个有趣的模式，它以连续恒等式 


K 


m + 


+ y - * y — l y — — 1 ， 3 ^ — 1 




m 


)K n (y n r- ,y\) 




(- 1 广 + ，…，： — ! ，0， - ： y „ ， — ％ — 1，…，—： Vi ) 

为基础。当: y „ = ，: y n _ i 等时，这个恒等式是最有趣的，因为 

+ 1 (q ，…， q ，0, ％ + 1 ，…， z „) = K n - i ( z i , ••- yZ k ^ x , z k + z k + l , z k+2 ，•-- , ) 

特别是，我们发现如果九/〜= — ! ( x 2 ，…， )/ K ^ ，…， ) = // h ，…， x „ //， 

Wll Pnl Qn ^ ~ WI q 2 , 二//：^，…，：^，，— ！，！，：^-}，：^-!，…，：^//。通过把 

…，:改变成 // Xi yJ 0 n -\ , X n - 1,1// ，我们可以随意控制符号（ - iy o 

例如，头一个级数的部分和有下列偶长度的连 分数： //1，1//;//1，1，1，1，0，1// 
=//1，1，1，2// ; //1，1，1，2，1，1，1，1，1，1// ; //1，1，1，2，1，1，1，1,1，1，1，1，0，1，1， 
1，1，1，2，1，1，1// = //1，1，1，2，1，1，1，1，1，1，1，2，1，1，1，1，2，1，1，1// ; 从这里开 
始，序列平稳下来并遵守一个简单的反射模式。我们发现，如果 n-l = 20 g + r *， 其 
中 0< r <20, 则第 n 个部分商可迅速计算 如下： 
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题答案 

fl , 如果 r = 0, 2,4,5,6,7,9,10,12, 

13，14，15，17，或19 
2， 如果 r = 3或16 

1 + ((? + r ) mod 2，如果 r = 8 或 11 
2~ d q1 如果 r = l 

d q + Xy 如果 r = 18 

这里 A 是由规则4 = 1，心„ = 4，^ + 1 = 0，心 +3 = 1定义的“龙序列”；习题4.1- 
18 中讨论的龙曲线在它的第〃步向右转当且仅当< =1。 

/>3的匕— 6 数等于///一1，/ + 1，/ 2 -1，1，/，/-1，/ 12 -1，1，/-2，/，1，/ 2 -1， 

/ + 1，卜1，/ 72 -1，〜//。第？2个部分商依赖于72 mod 4的龙序列如下：如果 n 

mod 4 = 1,则它是 Z - 2 + d n -\^r ( LW 2 」mod 4 ) ，而如果 rz mod 4 = 2,则它是 / + 2 — 

d n+2 - (L n /2 j mod 4); 如果 72 mod 4 = 0 ，依赖于 4=0 还是 1，它是 1 或 L )_ l ， 

其中々整除 n 的2的最 大幂； 当 Z 二 2时，可应用同一规则，但必须删去所有的0,所以 
同72 mod 24有关的模式更为复杂。 

[参考 文献： J . O . Shallit y J . Number Theory 11( 1979) ， 209 〜 217; Allouche , Lu - 
biw , Mendes France , van der Poorten 和 Shallit ， Acta . Arit/imetica 77(1996) ，77〜96。_ 

42 .假设 || qX II = \ qX - p \ o 我们总可以求整数 w 和 r 使得 g - 1 十叫„， 

{二 wh 」+ ，其中 A = UA 2 ，".， A „) ，因为 q n Pn -\ 一 q”-\Pn = 土 1。如果 

1 = 0,则这个结果是显然的。否则我们必定有1^<0，因此“（〜_ 1 叉-/>„- 1 )和 

v ( q n X - 九） 有相同的符号，且 I qX ~ p \ = \u \ \ q n -\X ~ p n _ x \ + \v \ \ q n X ~ p n \ 0 

这就完成了证明，因为〃关0。关于其推广见定理 6.4 S 。 

43. 如果: r 是可表示的，则习题40的 Stern - Brocot 树中： r 的父亲也是可表 7 K 

的； 于是可表示的数形成该二叉树的一株子树。设 （ Wt /) 和 （ W /) 是相邻的可表示 
的数。则这两个当中有一个是另一个的 祖先； 比如说可令 （ W /) 是 （ W /) 的祖先， 
因为另一种情况与此类似。于是， （ W /) 是 （ W〆 ） 最接近的左祖先，所以 uldl 
之间的所有数都是的左后裔，而中间值 （U + /)) 是它的左儿子。 

按照正则连分数与二叉树的关系，中间值和所有它的左后裔都将有 U //) 作为它们 
最后可表示的九/%，而所有中间值的左后裔都将有 （ W /) 作为 pjq t 之一。（在通 

到： c 的通路上的所有“拐弯节点”的父亲的标号是 P - Jqio ) 

44. M = N = 100时的一个反例是 （ w /:) = +，（ W ^/) = _。 然而，由于 （12) 的 

缘故，这个恒等式几乎总是 对的； 只有当 Wx / 非常接近等于比 U / z /) 更简单 
的分数时，它才不对。 

45 . 使用通常的长除法，为确定使得 “ = At ；+ r ，0< r < t 的 A 和 r ， 要花费 
0((1 +log A ) (log w )) 个时间单位。如果在执行此算法期间的商是 A 1 , A 2 ,--, 

，则 A 丨 A 2 ". < w ，所以 log Ai 十…十 log A m < logw 。由推论 L 也有 m - 
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O (log w ) o 

46 .是的，即使我们也需要计算将通过欧几里得算法计算的部分商的序列，也是 

0( n ( log n ) 2 (log log n )); 参见 A . Sch6nhage，Acta Informatics 1 (1971) ， 139 〜144。 

而且相对于它所执行的乘法和除法， S C h 6 nh age 的算法是计算连分数展开渐近最优 
的 [ V.Strassen SI COMP 12 ( 1983) ， 1 〜 27 ] 。 除非”十分地大，否则算法 4 . 5 • 2 L 在 
实际使用中是更好的。但在 A . Schonhage , A . F . W . Grotefeld 和 E . Vetter 的书 Fast 
Algorithms [ ( Heidelberg : Spektrum Akademischer Verlag , 1994) , §7.2] 中刻画了超 

过大约 1800 个二进位的数的一个有效实现。 

48. T, = (X ; _ 2 ( ~ a 2 , ~ ,K ; _ ~ ,X ； 2 _ ; (a j + j 

• _ | 

= (( -1 )义厂 2 (心，… ，〜- d ，（ _ 1 V K ; _ a !，••♦, a ; . _ j ), K ; J _ ; ( a ; + !，•**, < 2^ )o 

49 . 由于 Aa + p 和12：„ + 1 + juz n + j = - Xvjd ，有一个 的奇数值使得 Ax , 
+ IjlZj >0 和 Ax 」 + 2 + juZj + 2 ^0 o 如果 Aa + "勺 > 0 和 Ax ) + 2 + fj - z 3 + 2 < _ <9 ，我们有" 
> 61 Zj ^PA > _ 沒/:^ + 2 。由此得 0 < Xx } + 2 + fj . z - + 2 < XfJLX ) + i Zj Id - XfjtZj + l Xj + 2 19^： 

2A " W 卜 20 ，因为对于所有々我们有 + 

a n XK n 一 〆 〜，…，〜）^ vld 0 [ H . W \ Lenstra , Jr . ， Math . Comp . 42 (1984) ， 331 〜 

340。] 

50 .令 A = ，如果 々 a < y ，则答案为々；否则它是 

々 _ 1 + ~ f (( lla ) mod l y k Via ,k 1^1 a ) ~ 

a 

51 .如果 ax - = 3 ; 和: r 丄 3 ; ， 我们有丄 mz 。 考虑习题 40 的 Stern-Brocot 

树，连同以0/1作为标号的一个附加节点。对于每个节点标号 Wi 附加标记值 : y = 

■ 

ax _ mz 0 我们要求出其标记值的绝对值至多是 0 = 而其分母： c 也小于等于 

0 的所有节点 Wr 。 到这样的节点的惟一可能的通路保持在左边是正的标记，而在 
右边是负的标记。这样一个规则定义惟一的通路，当标记为正时它向右动而当标记 
为负时它向左动，当标记变成零时它停止下来。当以 u = m 和 w = a 执行算法 
4.5.2 X 时也隐含得出同样的通路，除非这个算法向前跳——它仅仅访问标记改变 
符号之前的通路的节点（如同在习题43中的“拐弯节点”的父亲）。 

令“工是其标记 3 ；满足的通路的头一个节点。如果： r > 0 ， 则无解，因 
为在通路上随后的值甚至有更大的分母。否则，假定 x 丄 3S 则 （士: r , T 30 是一个 
解。 

容易看出，如果^ = 0 则 无解; 而如果则在通路上的下个节点的标记将不会 
和 y 有相同的符号。因此由算法 4.5.2 X ， 将访问节点 z /: r ， 而且对于某个 ； 我们将 

有 x = Xj = Kj -^( a ly , aj ^ x ) , y = yj = ( - 1 ) (; l) K n - + , a n ) d , z ^ = 

Kj - i ( a 2 ，…， a ) <)( 见习题 48)。 对于 一 个解的下 一 个可能性将是带有标记：/ = ： y ; _ i 
+仏的标号 + 的节点，其中々尽可能地小使得 iy |< 

• 633 - 




题答案 


我们有 y ^<0 o 然而，/现在必须超过 A 否则我们将有 m 二 KAh ， …， 二 

x ' \ y \ + x | y K0 2 + = m ，因此等式不能成立。 

这个讨论证明，通过对于 w = m 和 t ； = a 来应用算法 4.5.2 X ， 这个问题可有效 

地求解，但通过替换步骤 X2 如下：“如果 m /2, 则算法结束。假定： c 丄: y 和 : r 

则数偶（: T ，30 = ( U 2 ISign ( i ; 2 )) 是惟一 的解； 否则无解。” [ P . S . Wang , 

Lecture Notes in Comp . Sci . 162 (1983) ， 225 〜 235; P . Kornerup 和 R . T . Gregory , 

BIT 23 (1983),9 〜 20。] 

每当 2 d l d 2 < m 时，如果我们要求0 <工<化和则一个类似的方法将 
有效 D 


4.5.4 小节 

1 . 如果 A 不是素数，则在试验 A 之前它的素因子已经被分解了。 

2 . 否； 如果九^ =九，则这个算法将失败，给出“1”作为假的素因子。 

3. 设 P 是头168个素数的积。[注 ：尽管 P = 19590〜5910 是一个416位数字， 
求这样一个 gcd 比做168个除法要少花很多时间，如果我们仅仅想测试 n 是否为素 
数的话。] 

4. 在习题 3.1-11 的符号下 


〉: lg max (/i +1, A )1 

V ， A 






其中 / ⑴ = 2 1< A < P 「 lginax ( 卜 1 如果 z =2“ 0 ， 其中 0< e < l , 我们有 /(/) = 
Z 2 (3.2 — 0 -2.2 _2 〃）， 其中函数 3.2 _0 -2.2 — 20 在 0 = lg (4/3) 处达到极大值 I ■，并且 

在沒= 0和1处有极小值1。因此2~_ ( 〃 + 1 〃 )1 的平均值位于1.0和 1.125 乘以" 
+ A 的平均值之间，由此得出结果。 

注: Richard Brent 已经发现，当 m — 00 时，密度 U l k = \(1 - kl m ) ~ exp ( ~ l(l ~ 

l )/2 m + 0( Z 3 / tt 2 2 )) 趋近一个正态分布，因此我们可以假定6是一致分布的。于是 

2*2 _20 取平均值 3/(4 In 2)，而且算法 B 所需的平均迭代次数近似地为 

(3/(4 ln 2) + |)/^7^ = 1.98277 /:。 当 /> 七2 .4771366 被“最优地 ，，选 定为 

( p 2 - 1 ) In p = p 2 ~ p + 1 的根奸[，对于习题 3.1-7 的答案中更一般方法的类似分析 

给岀〜1_2600“。参见 BIT 20 (1980),176 〜184。 

算法 B 是 Pollard 原来算法的一个改进，它是以习题 3.1_6 b ) 而不是以习题 3.1- 
7中还未发现的结果为基础的。他证明，使得= 尤 的最小的 tz 有〜（//12) 

Q ( m ) 〜 1.0308 的平 均值； 由等式 4.5.3-(21) 可得到常数7^/12的解释。因此 
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在他原来的算法中所需要的平均工作量大约是 1.03081 个 gcd (或者乘法模 

m ) 以及 3.09243 个平方。当 gcd 的花销大于大约 1.17 乘以平方的花销时 

-通常对于很大的数是如此，则实际上这将比算法 B 更好。 

然而， Brent 注意到，通过当 k > l /2 时，不去检查 gcd ， 可以改进算法 B; 如果重 
复步骤 B 4 直到在进行了 X \_£ ( ju ) I X i = i { fji ) — {£ { n ) mod A ) 个进一步的 
迭代之后，我们仍将探测这个循环。当我们取平方而不取 gcd 时，平均花销现在近 


似地变成 （3/(4 In 2))7 rcm/2 〜 1.35611/^ 个迭代，当我们两个都做时，则加上 
J(ln 7T -7)/(4 In 2) + y J/^rm/2 ^ . 88319 ^个迭代。[请见 Henri Cohen 在 A 

Course in Computational Algebraic Number Theory (Berlin : Springer,1993) ， § 8.5 中 

的分析。] 


5 .值得注意的是， 11111 三 8616460799 (modulo 3.7 



11), 因此对于 /V 


11111,(14) 也是正确的，但相对于模5除外。由于剩余 （ P - iV ) mod 5是4,0,3, 


3，0,我们必有 x mod 5-0,1 或4。满足所有条件的头一个= 106是= 
144;但 144 2 - 11111 = 9625的平方根不是一个整数。然而，下一个情况给出 156 2 - 

11111 = 13225 = 115 2 ,而且 11111 = (156- 115)-(156 + 115) = 41 -271 o 

6 • 让我们计算同余 N = ( x - y)(x + y ) ( modulo /? ) 的解 （ x ， ：y ) 的个数，其中 0 
《■^，^〈{。由于 iV _ 0 和是素数 ，: c + ： y ^ 0 。 对于每个 r 吴 0 ，有惟一的 u (模 p ) 

使得 N 三 ㈣ 。现在同余式 ： r _ y=u , x + ^三。惟一地确定了 : r mod />和 jy mod />， 

因为 f 是奇数。于是所述同余恰有 f - 1 个解 （ u )。 如果（: r ， y ) 是一个解，则如 

果 - 3O 也是解，因为 （p _ J ) 2 三而且如果（工， 3 ; 1 )和（：^ 3 ； 2 )是解且 
Vi #%， 则我们有3^ = 3 ^;因此 f -力。于是如果 N 三工 1 没有解，则在诸解 


“，30当中不同2值的个数是-1)/2,或者如果 N 三 x 2 有解，则不同 x 值的个 
数为 （P + 1)/2。 

7.—个过程是对于每个模数记住两个下标 ，一 个作为当前字的位置 ，另 一个作 
为当前位的 位置； 从表中取两个字，然后执行一个变址移位指令，可对表的项目进行 
适当的调整。（许多计算机都有特殊的设备执行这类位操作。） 

8•(我们可以假定 N = 2 M 是偶数。）下列算法使用一张辅助表 X [1], 

X [2],--, X[M-1],^4 1 X[A] 表示2々 + 1 的素性。 

S 1 •对于置 X[ ^ ] ^1 o 并且置7 — 1 ， 々—1 ， P — 3 ， g— 4。（在此算法 
执行期间/> = + 1, g = 27 + 2 j 2 o ) 

S 2 •如果 X [ j ] 二 0,则转到 S4。 否则输出〆它是素数），且置 々 — g。 

S 3 •如果 A<M， 则置 X [ kj <~0 f k^k + L 并重复本步骤。 

S4 •置 j —；■ + l，p —+2，g —+ 2/) —2。如果 j '< M ，则返回步骤 S2。 ■ 

如果在步骤 S 4 中相对于 M 测试的是 <7( 而不是_;•)，且如果附加一个新循环，它 

对等于1的所有剩下的 X [ ; ] 输出2 ; + 1，则这个计算的主要部分将显著地加快，并 
省去对 f 和 g 的操作。 
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注: Eratosthenes 有独创性的筛在 Nicomachus 的 Jntraductibn to Arithmetic 的第 13章， 

卷1中被描述。众所周知， I：, 素数 = lnlnN+M+ 0((log jVr 100(X) ) ，其中 
M= 7 + 2 々彡 2"( 々 ）In 〈（ k、lk 是 : Mertens 常数 0.26149 72128 47642 78375 54268 
38608 69585 90516-; 参见 F. Mertens,Greile 76 (1874)，46 〜 62; Greene 和 Knuth, 

Mathematics for the Analysis of Algorithms (Boston,Birkhaiiser,1981)，§4.2.3。 特 

别是，在 Nicomachus 描述的原来的算法中运算的个数是 Nln In N+ 0(N ) 0 在习 
题 5.2.3-15 和 7.1 节中讨论了对于生成素数的筛方法的效率方面的改进。 

9.对于某个素数如果是72的一个因子，则 f 是 A (72) 的因子，但不是72 - 

1的因子。如果其中是两个素数，则 是 A(n ) 的一个因子， 

因此 PiPl ~ 1=0 (modulo ( p 2 - l))o 由于/>2三1，这意味着是 p 2~ ^的倍 
数，同的假定矛盾。[使得 AU) 真正整除 72-1 的那样的 72 值，称为 
Carmichael 数。例如，下边是具有至多六个素因子的一些小的 Carmichael 数:3.11. 

17,5- 13 • 17,7 * 11 • 13 • 41,5 • 7 • 17 • 19 • 73,5 • 7 • 17 • 73 • 89 • 107 o 小于 10 12 的 

Carmichael 数共有8241个，而且小于 iV 的 Carmichael 数至少有 m/V 2/7 ) 个； 参见 
W. R. Alford，A. Granville 及 C. Pomerance,Annais of Math . (2) 139 (1994)，703 〜 


722 0 ] 

10. 设心是的模 72 阶，并设 A 是所有心的最小公倍数。则 A 是 n _ l 的因 
子，但不是任何（/2 - l)/f 的因子，所以 A = t2 _1。 由于对所有的 p , x^ (w) mod n = 

l，p(72) 是心 的倍数，所以 cp ( n)>Xo 但当”不是素数时，〆 72)<n_l。 （证明这 
一 点的另一途径，是用习题 3.2.1.2-15 的方法，从诸 A 构造一个阶为 n -1 的元素 



11 . 


U 

V 

A 

1984 

1 

0 

1981 

1981 

1 

1983 

4 

495 

1983 

991 

2 

1981 

4 

495 

1984 

1981 

1 

1984 

1 

1984 


P 

S 

T 

992 

0 


992 

1 

1981 

993 

0 

1 

98109 

1 

991 

2 

0 

1 

99099 

1 

1981 

99101 

0 

1 


输出 


993 2 = + 2 2 

2 2 三+ 2 2 

99101 2 三十 2 0 


从头一个或最后的输出来看，因子分解 199*991 是明显的。循环的简短性，以及熟 

知的数1984的出现，大概都仅仅是巧合。 

12•下列算法利用由整数 E jky 0< Jf k < m 构成的一个 （m + 1) X ( m +1) 阶辅 

助矩阵 ，一 个单精度向量（心，心 ， 6 2 ，…， ) 和其元素处于范围内的一个 


多精度向量（:，…，: r w ) 


F1 •[初始化]对置卜 —-1; 然后置0 


4.5.4 小节 


F 2 •[下 一 个解]得到由算法 E 产生的下一个输出 （ u 0 ， q ， …， 〜）。（把算 

法 E 和 F 看做共行程序是方便 的。） 置 k — m 。 

F 3 .[寻找奇数]如果々<0,则转到步骤 F 5。 否则如果 Q 是偶数，则置 k^k 

-1，并重复这一步骤。 

F 4. [线性相关？]如果，则对 m ，置 i — b k ， x ^ ( x- t x ) mod N , e r 
—+ £,. r ; 置 k — k — \ 并返回 F 3。 否则对于 m ，置 b k — j 

置 j +1 并返回 F 2。 （在后一情况下，我们有一个新的在模 2 下 

的线性无关的解，它的头一个奇分量是 C 。 不保证£：„保留单精度，但当々 
从 m 减少为0时，如同 Morrison 和 Brillhart 所推荐的那样，它们趋向于保 

持小的值。） 

F 5 •[试分解因子](现在4，^，…，〜是偶数。）置 

3 ； — ((- I )%’ 2 p ?’ 2 … P )/ 2 ) mod N 

如果 x — y 或 : c + = iV ，则返回 F 2 。否则计算 gcd (:，它是 N 的 

真因子并终止本算法。 ■ 

只要能从算法 E 给定的输出导出一个因子，这个算法就能找到一个因子。 [证明。 
设对于纟，算法 E 的输出是（足，尽0,…， £, w )， 并假设当 xeA …； C 和 y 三 

(-1广。 /2 〆 / 2 …心 /2 ( modulo N ) 时，我们可以求出一个因子分解 iV = 其中对 

所有的 j , e } - a 1 十…十都是偶数。则 j ： 三土 ： y ( modulo ) 和 i e T ：y 

(modulo N 2 )。 不难看到，这个解可以变换成为在 F 5 步中出现的一对（: r ，30。 办法 
是通过系统地用 （ :?: 〆 ，3{/)代替（:?: ，： y ) 的 一 系列步骤，其中 x = ± / (modulo N ) 0 ] 

13. 有 2" 个: r 的值有相同的指数（以，…，‘），因为当 N = q ^“ c // 时我们可任 

意选择 x modulo ^ 的符号，这2〃 个值当中恰有两个不能分解成因式。 

14. 因为对于 V 的任何素因子 p ， J ° 2 三 / WQ 2 ( m 0 dul 0 f )， 如果 P 吴0,我们得到 

1 三 P 2 (广 1)/2 e (々 NQ 2 ) (广 0/2 三 UN ) (々一 1)/2 (modulo p ) 0 

15. R = 沪)/#，其中 a = y(P + / D ),6 = y ( P -/ D),D = P 2 - 

4 Q 。 于是所以如果 p 是一个奇素数，则 U 产 

D ( ^ 0/2 (modulo />)。类似地，如果 V ，，= 〆 十 Y = L /„ + 1 - QL ^ -”则 2 /,_1 V w = 

而且 V p = PbP 。 因此，若三-1，则我们求得 U p + [ mod p 

= 0。如果心三仫则求得⑴^/^) mod p ^ O ; 这里如果 Q 是户的倍数，则对于 n 
>0, L /^ P ^ 1 (modulo {)，所以％绝不是 p 的 倍数; 若 Q 不是 f 的倍数，则 U p - X 

mod p = Q 。 因此像在定理 L 中那样，如果 N = fy - 〆 /，则 R mod N = Q ， N _ LQ ， 
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且/二(乂厂\岛+ 9))。在本题的假定下， N 出现的阶是 N + 1; 因此 N 与 
Q 互素，而 r 是 ] V + 1 的倍数。又本题的假定意味着每个&是奇数且每个^是±1， 

所以，^ 2 1 r XX 〆 / — 1 ( A / + \ ~ 2、吾 ) N ;因此厂=1 和 / = /?? + f 1 Z 1 1 。最 

后， q = 1 和 q = 1。 

注： 如果要求关于不可约性的这个测试真能有点用处，则我们必须以使得这个 
测试可能奏效的方式选择 P 和 Q 。 Lehmer 提议取 P = I 使得 D = l - 4 Q , 并选择 
Q 使 N 丄 QD 。 （如果后一条件失败，则我们已经知道 N 不是素数，除非 I QD | > 

JV 。） 而且，上面的推导表明我们将要求 q = l ， 即 D (N — 1)/2 =-1( modulo N ) 0 这是 

确定对 Q 的选择的另一个条件。此外，如果 D 满足这个条件且 U N + , mod N 判， 

则我们知道 iV 不是素数。 

例子 ：如果 P = 1, Q = - 1，则我们有斐波那契序列，且 D = 5 0 由于5 11 三 
- 1 (modulo 23) ，我们可能想通过使用斐波那契 序列： 

( F „ mod 23)=0,1,1,2,3,5,8,13,21,11,9,20,6,3,9,12,21,10,8,18,3,21, 

1，22，0，… 

来证明23是素数，所以24是23出现的阶，因而此测试有效。然而，不能以这种办 
法用斐波那契序列来证明13和17的不可约性，因为 F 7 mod 13 = 0和 F 9 mod 17 = 

0。当 三土 1( modulo 10) 时，我们有5 (/5 mod /? = 1，所以 (不是 F p + i ) 

为 P 整除。 

17. 设 /( g ) =2 lg - 1。当 g =2或3时，这树至多有 / U ) 个节点。当 g >3 
为素数时，设 q = 1 + W …仏，其中且 qi ， …， q t 是素数。树的大小小于等于1 
+ 2/(%) =2 + /( g -1) -〖</((?)。 [SJCOAff 7 (1975)，214〜220。] 

18. : r ( GU ) - F ( a )) 是中其第二个最大的素因子和最大素因子> 
x G 的个数。因此 

xG (t)dt = (Tr(jo t + dt ) - k(x l )) • x 1 1 (G(t 1(1 - t)) — F(tl(1 - t))) 
^的概率是 f 1 F ( i /2(1 _ O ) 〖 _1 心。[奇怪的是，可以证明这也等于 

- t )) ck ， 即 log A / log : r 的平均值，而且它也等于习题 1.3.3-23 和 3.1- 

13的 DickmarrGolomb 常数.62433。导数 G (0) 可以证明是等于 

1 F ( tl(l - t )) t~ 2 dt = F ( l ) + 2 F 
Jo 

第三个最大的素因子有 H ( a ) = \ a ( H(tKl - t )) - G ( tl(l - 和序⑹= 

^ 0 

00 o 见 P . Billingsley y Period . Math . Hungar . 2 (1972)，283 〜 289 . Galambos ^Acta Anth . 31 

(1976)，213 〜 218; D . E.Knuth 和 L . Trabb Pardo y Theoretical Cojmp , Sa ' 3 (1976) ,321 


1 




2 


+ 3 F 


3 


+ 


=e 


y 
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348; J . L . Hafner 和 K . S . McCurley J . Algorithms 10 (1989)531 〜 556。] 

19. M = 2 D -1 是所有这样的 p 的倍数，对于这些 p ，2 的模 p 阶整除 D 。 为了 

推广这一思想，设2 和〜 + 1 = * mod N ， 其中％ = p ) , Pj 是第 j 个素数，^. = 
Llog 1000/ log 巧」;设 A = a 169 。 现在对于 10 3 和 10 5 之间的所有素数 （？ 计算\ = 

gcd ( A <? - l , N ) 0 做这件事的一个办法是由 A 1009 mod N 开始，而后交替地乘以 A 4 
mod N 和 A 2 mod N (类似的方法曾为 D . N . Lehmer 于 20 世纪 20 年代使用过，但他 
没有发表它）。如同对于算法 B —样，我们可以通过成批计算来避免大多数 g C d ; 例 
如，由于 b 30 r _ k ^ g cd ( A 3 ^- A \ iV ) ，我们可以尝试8个一批地首先计算= ( A 30 ^ 

- A 20 )( A 30r ~ A 23 )--*( A 30 r - A ) mod N ， 然后对于33<厂<3334计算 gcd ( c r , N ) 0 

20. 参见 H . C . Williams , Math . Comp . 39 (1982) ，225 〜 234。 

21 . 有关这个猜测的某种有趣的理论已经由 Eric Bach 作了介绍， Information 
and Computation 90 ( 1991 )，139〜155。 

22. 仅当随机数: r 没有揭示出 n 是非素数这一事实时，算法 P 才算失败。比如 

■ 

说，如果 P mod ” =1或者如果对于 0< j < 々，数之一同余于 -1( 模 n )， 则我们 
认为工 是坏的。由于1是坏的，我们有 p n = [n 非素数] (乂 - l)Kn ~2 )<[n 非素 

数' \ b n l (n - 1)，其中~ 是使得72的坏 jc 的个数。 

每一个坏 jc 满足: 1 = 1 (modulo n ) 0 当/>为素数时，对于同余式 
x 9 = l ( modulo 〆 ）的解的个数是对于 0<： v < - 1) ， ^ = 0 (modulo p e 一 ' ( p - 

1)) 的解的个数，即 gcd ( g ，/ _1 ( f - l ))， 因为我们可以用 V 代替 X ，其中 a 是一个 
原根。 


设其中乂是不同的素数。按照中国剩余定理，同余式 / — 1 三 l(modub 
n ) 的解的个数是 Il^gcdU - _ 1))，而这至多是 n ；^( 72 z _ 1)，因为〜 

与77 -1 互素。如果某个4>1，我们有 77 z - l <|~<，， 因此解的个数至多是1^2;在这 

y y 

种情况下乂 <吾打<|(7? -1)，因为 71^9 0 

因此我们可以假定，72是不同素数的乘积〜。设义=1 + 2 k iq t , 其中 

… <々 r 。则 gcdU -1 ，〜 -1)=2^;，其中々； = min(H)， 且 q ；= gcd ( q y q t ) 0 

■ 

按模计算，使得/三1 的工 的个数是义 :； 对于使得:三 -1 的： r 的个 

数是 2V ,， 否则为0。由于々，我们有 乂 = 6…心 （1 + 2 ⑹ <~2，）。 

为完成这个证明，只须证明 乂 <+gn 2 、 + ‘‘ + 〜 = ^U)， 因为 cp ( n )< 
n - 1。我们有 

(B < (1 + 糾， ） /2V = 
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题答案 



l/(2 r - 1) 



( 2 r - 2)/(2 


( 2 r - 1 )) < 1/2 


-l 


所以除非 





々 2 ，否则即得出结果。如果 




2,习题9表明 ， n _ 1 不是 rz 


- 1和 722 - 1两者的倍数。因此如果々1 


是 2 ,我们不能有 d = w 和 W 


q 2 两者。 


由此得岀，在此情况下， 



和 b n 《~^ cp(n ) 


[参考文献: J . iVumber Theory 12 (1980) , 128 


138。]这个证明表明，仅在两种 


情况下，即当 n 是 



) 或特殊形式 （1 



2 qi )(\ 



)的 


Carmichael 数时九接近于含。例如，当 rz = 49939 • 99877时，我们有心= j (49938 




99876) 和 p n ^ .24999； 当 ” =1667 • 2143 • 4523时，我们有= -^(1666*2142 


4522) ，九〜 .24968。关于进一步的注释见下一答案 

23. a ) 也许除了互反律外，这些证明是简单的。 

中 久和％ 是素数，则 


设 P 



A 和 g = <? i … I 其 


A 

Q 


n 


Pt 



TI(-i) 


(p. -1) (^ -1 )/4 Qj^ 

' J \pi 




P 


所以我们只需验证 2 


( p, - 1)(% _ D/4 


(p ~ l )( q ~ 1)/4 (modulo 2) 0 但是 2,( 声 


-1)( 屮 -1)/4 


(2 7 ；(^ 2 -1)/2)(2],(^ - 1)/2) 是奇数当且仅当奇数个 A 和奇数 



q ) 同余 3( 模4)，而这成立当且仅当 U _ 1)(9 _ D /4 为奇数。 [ G . G . J . Jacobi ， 


Berich t Konigl Preuj ^ Akad . Wiss . Berlin 2 (1837 ), 127 ^ 
Math . Pures.Appl .12 (1847))，497 〜 520 ，讨论了其有效性 


136; V . A . Lebesgue , J 


b ) 如同在习题 22 中那样，我们可以假定 n 


71 


其中 


k 


是不同 


的素数，且我们设 gcd(n 


成像素数，则我们称 


X 


是坏的。命 n „ 


1 ， 〜 -1) 


2^ 〆 ，而且如果它错误地把 n 弄 


min( U — 1 ) 


是 


X 


( n - l )/2_ 1 的解的个 


数。使 


X 


71 


1的坏 x 的个数是 n n ，当々 iCA 时还要乘以一个额外因子 


2 


需要 


2 


这个因子以确保当匕< 々时有偶数个化使 


X 


n 


1 o ) 如果々1 



，则使 


x 


n 


-1 的坏 x 的个数是！!„，否则为0。[如果工 


(n - I )/2 


- 1( modulo nj 且如果々 


k . 


我们有 (f )= -1; 如果 <.>6，则(彔)=+ 1;如果 k t < k 则矛盾。如果 hU 
有奇数个 t 等于々。] 

注:仅当 72 是匕 〈々的 一 个 Carmichael 数时， 一 个坏的猜测的概率〉;例如， 
n =7 • 13 • 19 = 1729,这是在另一个场合被 Ramanujan 弄出名的一个数 。 Louis 

Monier 已经推广了上述分析以得出一般的坏 x 个数的下列准确的公式： 
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这里 < 是本题中坏的2的个数，心是 2( 如果幻 = 0或如果 k t < k 和对某个 z _, 
A 是奇数）或 1( 否则）。 

c ) 如果 ： mod 72二 1，则 1= :^~) = j = ^ 0 如果 X 2q = 1( modulo 

rz )， 则对于”的所有素因子 A ， x 的模 n , 阶必定是2 ; + 1 的奇数倍。设72 = n ; 
和〜 =1 + 2』 + 1 <;则) = (-1)<，所以根据是偶数或奇数， )= +1或 

-1。由于 72 = (1+ 2^ 1 2 w ; / ) (modulo 2』+ 2 )，和2>¥是奇数当且仅当 j + 1=々 
[Theoretical Comp , Sci . 12 (1980) ， 97 〜 108] 。 

24 .设 iV ^ 是一个矩阵，对于在 l < n < N 范围内的每一非素奇数 n 它有一行， 

并有编号由2到 N 的 N - 1个列；如果 n 通不过算法 P 的 x 检验，则72行 x 列处的 
元素为1,否则为0。当 + r 和 0< r < rz 时，我们知道行72至多含 -l + g (乂 

+ 1) + min ( b n + \ y r)<q ^( n - l ) + lj + min ( b n + r <?/z + min ^72 ，r 丨= 

+ N + min (女 n - + \ ^ 个兀 i 素等于0,所以在此矩阵中至 

少有一半元素是]_。于是， Mi 的某个列：^至少有一半的元素等于1。删去列〜和 
在这列中含1的所有行，就剩下了具有类似性质的一个矩阵 M 2; 重复运用这个构造 

能产生具有 N - r 个列和少于 iV /2 r 个行的矩阵 M ,， 而且每行至少有 ^ ~(N - 1) 个 
元素等于 1 [参考 FOCS 19 (1978) ，78]。 

[一个类似的证明隐含着如下事实 ：存在 一个无穷序列 ： n <: c 2 <‘" ，使得数 n 
>1是素数当且仅当对于 X = Xi , , X = x m 它通过算法 P 的： C 检验，其中 m = 

yLlg nJ(Llg n 」- 1)。是否存在一个有此性质的序列 A < x 2 < … ，但 m = 

0( log 72)?] 

25 .这一定理首先是由 von Mangoldt 严格地证明的 [Creiie 114 (1895)，255 〜 

1^00 

305]，他事实上证明 0(1) 项是 C + dtl (( t 2 - l)t lrw )， 如果72是一个素数的第 

k 次幂，贝 !J 减去 1/2 K 常数 C 是 U 2_ ln 2 = */ + lnln 2 + ( In 2 ) ”/ ■ ! = 

0.35201 65995 57547 47542 73567 67736 43656 84471 +。 


參 
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习题答案 


[关于在 von Mangoldt 的论文之后的100年期间发展的综述，参见 A . A . Karatsuba ， 
Complex Analysis in Number Theory (CRC Press , 1995)。 关于黎曼假设和有关整数的具 
体问题之间的关系的出色介绍，也可参见 Eric Bach 和 Jeffrey Shallit , Algorithmic Number 

Theory l y (MIT Press ，1996), 第 8 章。] 

26 •如果 iV 不是素数，它有素因子由假设，/的每个素因子 f 有一个 
整数％使得心的模阶是 N -1 的因子，但不是 （ iV - l )/ p 的因子。因此如果/ 

整除/,则心的模 g 阶是/的倍数。习题 3.2.1.2-15 现在告诉我们，有一个模 g 

阶为/的元素 x 。 但这是不可能的，因为它意味着（? 2 >(/十1) 2 >(/+ l ) r > N ， 而 
且等式不可能成立。 [ Proc . Camb . PhiLSoc . 18 (1914) ，29〜30。 ] 

27 ■如果々不为3所整除且如果 k <2 n 十1，则数12” + 1是素数当且仅当 

3 2 &三_ l(modulo A *2” + 1)。因为如果这个条件成立，由习题26知2” + 1是 

素数； 而且如果 k -2^1 是素数，则由二次互反律知数3是二次非剩余模》_2” + 1， 

因为（是 .2” + 1) mod 12 = 5 。 [Proth 在 Comptes Rendus Acad . Sci . 87( Paris ，1878) ， 

926 中不加证明地指出了这个测试。] 

为了以必要的效率实现 Proth 测试，我们需要有能力以大约和计算 ^mod (2” 
-1) 相同的速度计算 x 2 mod U .2” + l )。 设： c 2 = A . r + 于是 x 2 = B ~ lAlk ] 
+ 2 ”（A mod 々），所以当々是一个单精度的数时，容易得到剩余。 

[为检测形如3_2” + 1的数的素约性，工作只是稍微困难 一点； 我们首先试验随 
机的单精度数直到通过二次互反律求出一个二次非剩余模 3 . 2 ” + 1，然后使用这个 
数代替上述测试中的“3”。如果 Tz mod 4尹0,则可以使用数5。当 /i = 1，2，5，6，8， 

12，18,30，36，41,66，189，201，209,276,353,408,438,534,2208,2816,3168,3189, 

3912, 20909, 34350, 42294, 42665, 44685, 48150, 55182, 59973, 80190, 157169, 

213321时， 3*2” + 1是 素数； 而且在小于等于300000的数中，没有其它的^ 了； 而当 
n = 1,3,7, 13, 15,25,39,55,75,85,127,1947,3313,4687,5947,13165,23473, 
26607,125413,209787,240937时， 5.2” + 1是素数而且在小于等于300000的数中 
没有其它的了。见 R . M . Robinson ^ roc . Amer . Math . Soc . 9 (1958),673 — 681; 

G . V . Cormack 和 H . C . Williams , Math . Comp . 35 (1980), 1419 〜 1421; H . Dubner 和 
W . Keller , Mat / i . Comp . 64 (1995) ,397 —405; J . S . Young , Math . Comp . 67 (1998), 

1735 〜 1738。] 

28./(0，^^0=2/(/) + 1) + /(/)，^0/户，因为1/(^ + 1)是义为0 的倍数的概率。 

当 d mod p ^0 时 /( p ， W ) = l /(/) + l )。 /(2,4々 + 3)=如因为4 2 -(4々+3)护不可 

能是4的 倍数; /(2,8々+ 5) = | ■，因为 A 2 - (8々 +5) B 2 不可能是8的 倍数; /(2,8々十 

1) 二 + j + ^ ■十+ + ^ 对于奇的 p ， 如果 d ip ~ l)l2 mod p 分别等于 （1 , p 

—1) ，贝 ll f { p , d ) — (2 pl ( p 2 - 1) ,0) o 



29 •在非负整数： r , 中，不 等式叫 +…+ 的解的个数是 ( 价=^ >. m 7 

r ! ，而且这些解的每一个对应于惟一的整数[在对于所有的 j ， pj 是 

第 j 个素数的特殊情况下，关于更精确的估计，见 N . G . de Braijn , Indag . Math . 28 
(1966) ， 240 〜 247; H . Halberstam ， PVoc . London Math . Soc . (3 ) 21 (1970)，102 〜 

107 o ] 

30 .如果 (modulo %)， 我们可以求得乂使得灼…心三（土乂） 2 
(modulo ) ,因此由中国剩余定理我们得到 X 的 2" 个值，使得 X 2 三 〆 卩…心 

(modulo N ) 0 这样的 Oi ，…， ) 至多对应于 f 对有所提示的性质的 （ <，…， 

4 ;<，•••，0。现在对于/个二进数 a =(幻〜~) 2 的每一个，设〜是使得 （& 
… 4) ( l 1)/2 = ( -DNmodulo %)的指数 （< ，."，0的 个数； 我们已经证明所需要 


的整数X的个数>212一 


r 


a 


r 


12 


。由于 Yj a n a 是允许重复地从 m 个对象的 一 


个集合选择至多 r/2 个对象的方式个数，即 


m 




12 


r/2 


，我们有 


2 〜 (m + rl2 


r 


12 


2 d ^- m r I (2^(r/2) ! 2 ) 0 [参见 /.Aigon’t/nns 3 (1982), 101 
对定理 D 的许多进一步的改进。] 


, 


127,其中 Schnorr 介绍了 


31.置 


71 


M ,pM 


= 4m“M = 2m， 以证明 Pr(X<2m )<e" m/2 0 

，并设每个信息的位置 ^ 被限制在范围 0<:c<M 3 -M 2 中。 


32 .设 M 


3 



如果 


X 


，则和以前一样把它编码为 


X 


mod N， 但如果 x < M 就把编码改变成 


X 



yM ) 3 mod N， 其中 y 是在 M 2 - 范围内的随机数。为了译码，首先 


取立 方根； 而且如果结果是 M 3 — M 2 或更多，则取模 M 余数。 


34 •设 P 是 :r w mod p 


1的概率且 Q 是 : mod q 


1 的概率。 gcd ( x m - 1 , N ) 





- Q ) + Q (1- P ) = P + Q -2 PQ 0 如果 或 Q<y JiJ 


这个概率 >2(1( T 6 -10 


—12 


) ，所以在大约 10 6 log m 次模 N 下的算术运算之后，我们 


有一个好机会寻找一个因子。另一方面，如果 P> 音和 Q >^ ■，则义1，因为 


我们有 一 般的公式 P 


gcd( m，p-l)//?; 于是在这种情况下 m 是 lcm ( p - l y q - \) 


的倍数。设 m = 2V， 其中 r 为奇数，构造序列 jc r mod N ， x 2r mod N ， 


k 


m m m 




r mod 


iV; 如同在算法 P 中那样，我们将以大于等于音的概率发现 1 的头一次出现的前边 


有不同于 N- 1的一 个: y 值，因此 gcd(^y - 1，N) 


p 或 qo 


35•设/ 


(P 


Q - 1 


Q 


p ^ \ 


)mod iV ，由于 p mod 4 


q mod 4 


3,我们有 


~P 


习题答案 


/ - 1 \ 
\ Q / 


(/\ 

\P I 


(子)二-丄，我们还有(吾) 



给定在 


_ 5) 范围内的一个消息 x ， 命 x - 4 x + 2 8 x + 4,按哪个无满足 = l 而定；然 

后传送消息无 2 mod N 。 

为了对这消息进行译码，我们首先使用一个 SQRT 框来求岀惟一的数 I 使得 
/三 fmod 〜且(#) = 1和 y 是偶数。于是 y = L 因为 f 的其它三个平方根是 


N -无和 （士负） mod N ; 这些根的头一个是奇数，而其它两个根有负的雅可比符 
号。如果: y mod 4 = 2,则通过置: r —{ jM 」， 否则工― L ： y /8」 来完成译码。 

任何可以对这种编码进行译码的人也都能找到 N 的诸因子，因为当 -1 

时，对一个错误消息王 2 mod N 的译码揭示了 （士 /) mod N ， 而且（（土 /) mod N ) - 
1和 N 有 一 个非平凡的 gcd 。 [参考文献： IE _ E £ Transactions IT -26 (1980)，726 〜 

729 0 ] 

36 . 由 （4) ，第7?2个素数等于 In m + m in In w _ m 十 m In In ml \n m ~ 2 ml 
In m + O ( m (log log m ) 2 (log m ) — 2 )， 尽管对于这个问题我们只需要较弱的估计 
p m ~ m in m + 0( mlog log m ) 0 (我们将假定，是第 m 个素数，因为这对应于 


V 是一致分布的假定。）如果我们选择 In 



V In N In In N ， 其中 


二 0(1), 


我们发现 r = c 1 y In N / In In N 2 — c 2 (ln In In N / lnlnN ) _ 2 c- 2 (ln 士 c / 
In In N + OC^ln In N / In N ) 0 原来估计的运行时间 （22) 现在出人意外地简化成 

exp (/( c , N)Vln N In In N + 0( log log IV )) ，其中 /( c ， N ) = c + (1 _ (1 + In 2)/ 
In In N ) c - 1 。 使 /( c ， N ) 取极小的 c 的值是 71 _ (1 + In 2 )/ln In N ， 所以我们得到 

估计式 


exp (2 \/in N In In N a /1 - (1 + In 2 )/ln In N + 0 (log log N )) 

当〜=10 5() 时，这给出 KN ) 〜.33,它仍比我们所观察到的大得多。 

注: / S 的部分商的情况似乎有与 4.5.3 小节中随机实数得到的分布一样的特 
性。例如，在数10 18 +314159的平方根的头100万个部分商中 ， A „ 分别是（1，2,3, 

4) 的情形恰好有（415236，169719,93180,58606)种。而且，由习题4 . 5 .3_12( c ) 和等 
式 4.5.3-(12) 我们有 V „ + 1 = | / -Ddl = 2 十 0( q - n 2 )。 因此 

我们可以期望 VJ 2 \/万实质上有和量 d n ( x ) = q n \ p n ~ xq n \ 类似的特性，其中： c 是 
一 个随机实数。已知随机量^对于0<0<1有近似的密度 mind ,^" 1 - l)/ln 2 
[见 Bosma，Jager 及 Wiedijk ,/ nc / ag . Math . 45 (1983)，281 〜 299] ， 当 6 dl 2 时它是 一 * 
致的。因 此除八 的大小之外还有其它原因解释算法 E 的不合理效率。 
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4.5.4 小节 


37.把习题 4.5.3-12 应用于数#+只，可以看到周期部分立即开始，然后逆向 
遍历这个周期，以检验它的回文性质。[由此得出，这个周期的下一半给出和头一半 
相同的 V ，通过在步骤 E 5 中当 LT 或铲时结束之，可以使算法 E 较早地停 

下来。但是，这个周期一般很长，我们甚至不可能接近于它的一半，所以没有理由使 
这个算法更复杂。] 

38•令 r = (10 50 - 1)/9。于是 P 0 = 10 49 十9;匕 = r + 3 • 10 46 ； P 2 = 2 r + 3-10 47 + 

7; P 3 = 3 r + 2- 10 49 ; P 4 -4 r +2-10 49 - 3; P 5 = 5 r + 3-10 49 + 4; P 6 = 6 r + 2- 10 48 + 3; 

P 7 = lr + 2, 10 25 ( 非常漂亮 ); P 8 = 8 r + 10 38 - 7; P 9 = 9 r - 8000。 

39 .注意当 g - 1 恰有 2 和 p 作为素因子时，容易证明 g 的素约性。2的仅有的 
后继是费马素数，而且第六个费马素数的存在与否是数论中最著名的未解决的问题 
之一。因此我们大概将永远不知道如何来确定一个任意的整数是否有任何后继。 
然而，在某些情况下，这是可 能的； 例如，在 W . Siewpihski 证明了没有后继的无穷多 
个奇数的存在性 [•Eiemente der Math . 15 ( 1960 )，73〜74 ] 之后 ， John Self ridge 于 

1962 年证明 78557 和 271129 没有[参见 AMM 70 (1963) ，101 〜 102] 。也许78557 

是这些当中最小的，尽管按照 G.Jaeschke 和 W . Keller [ Maf / i . Comp . 40(1983),381 
〜384,661〜673; 4 5(1985)，637]的论述，在1983年仍然存在其它69个竞争者来竞 
争这个荣誉。 

关于更传统的素数链的 “ Cunningham ” 形式，其中转换是 p — 2 p ± 1，参见 
Gunter Loh Math . Comp . 53(1989) ， 751 〜759。特别是， L 6 h 发现，对于< 12, 
554688278430.2》-1 是素数。 

40 .[ Inf . Proc . Letters 8 (1979) ，28〜31。 ] 注意在这样一台机器上，可以很容易 
地计算 x mod )=工— yLWy 」， 而且我们可以得到像 0 = x - x，l = Lx / x 」，2 = l + l 
这样简单的常数；通过测试 : r = 1还是 Lx /(2 - 1)」#0,我们可以知道是否 X >0 o 

a ) 首先通过重复地除以2在 0 (log / z ) 步内计算 Z = [lg / 2 ] ; 同时通过重复地置 

A 2 , 在 0 (log n ) 步内计算 k —2 l 和 A — 2 2; + 1 。对于主要的计算，假设我 
们知道 Z = A 7/I ，w = (A + l) w ，S 于是通过置 m — m + l ， 我们可以把 m 的 

值加1，置 t ^~ At ( A 十1 ) w , v — vm ; 然后通过置 m — 27n 我们可以把 m 的值 

加倍，假定 A 充分大，置 u ^ u \ v ^( iult ] mod AW，t — tK f 考虑用 A 进制表 

_„ / 2, 7 Yl \ \ 

示的数 W ; A 必须大于 。现在如果” = U /" Wo )2, 设％ =(屮."七） 2; 如果肌 

\ m I > J 

=乂和々=2」及>0,通过置 k ^ lkl 2] y m ^2 m + ( In/kj mod 2) ，我们可以把 ，减 
1。因此对于 J = /，/ - 1，•••，()，我们可以在 0( log n ) 步内计算 n ,!。 [由 Julia 

Robinson 给出的另一个解，是当 — 1 时计算；?！ = L B n I 参考 AMM 

\ n I 

80(1973) ，250〜251，266。] 

b ) 如同在 a ) 中一样，首先计算 A =2 2/ + \ 然后找使得公 + 1 ! mod n =0 的最小 
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题答案 


的々>0。如果 gcd ( n ，2^)# l ， 则命 /( n ) 是这 个值； 注意，用欧几里得算法可以在 


m 


0 (log n ) 步内计算这个 gcdo 不然，我们将找出使得 I mo< ^ 71 = ^的最小整 


数 m ，并令 /( /2 


gcd ( m ， n ) 


(注意在这种情况下 2 k < m<2 


，因此， 「 m /2]< 


m 


2 k ，而且「 w /21 !同？！互素；因此丨 M , mod n = 0当且仅当 m ! mod ” = 0。而 

\ Lm /2 J / 

且 n ^4 0 ) 

为了用有限个寄存器计算 m ， 我们可以使用斐波那契数（参考算法 6.2.1 F ) 0 


假设我们知道 


，/ = F / + 1 , t 




A F ， ， 〆 = A r i + 1 ， w = (A + 1 


F 


2F. 


， i / = (A + 


1) 


2F 


i + i 






y W 


(A + l ) 2m , 


2m 


mod n 7^0 ，且 


2( 772 + 5 ) 


mod Tt ^ 0 o 


m 


m 


m 



F 


，对于适当大的 j ，容易在 0( log ? 2 )步内做到这 


点； 而且 A 将比2 2( ” 1 + 5) 更 


大。如果 




1，我们就置 /( n ) ~ gcd ( 2m + 1 ， n ) 或 gcd (2 m + 2 ， n ) ，它们无论哪一^ 


个不等于1，就终止此算法。不然，我们把7减1如下：置 r 


<— 


S y S 


^— 







, r 


<— 


u , u^l u \ u \, w ' —r ; 然后如果 （L wWn」mod A ) mod 


n #0, 则置 rn 


m 



s j w 


wu , v — vt 0 


[这个问题能否用少于 0 (bg n ) 次运算来解？ 22 的最小或最大的素因子能否 


在 0( l 0 g 72) 次运算内算出？] 

41. a ) 当时显然有 tc ( x ) 




Trim) + f^x y 


m 




7r ( m ) + f(x y m ) 


f 0 (x , m ) - f 2 (x , m ) ~ f 3 ( x , 

A ( n 3 , n ) = 0 o 


m 


)— 


镛蠡摹 


o 置工 


N \ 


m 


N ， 并且注意对于 k >2 7 


b ) 我们有 f 2 ( N \ N ) 




E 


1 ) 


2 N< … 3/2 WN 3 / 夕) 


N< p^q [ 

一 { \r3/2 


[ pq < N 3 ] 


2 N << N 3/2 ( 丌 （ N 3 /p) -7r(p) 



7 T 


/ 2 (1000，10) 


7 T 


1000 

"IT 



TC 


(N 

2 


1000 

"TF 


+ 



K 


tt ( N ) 

2 

' 1000 、 

.TT , 


其中户 


和 o 为素数。因此 



TC 


1000 

~W 



TC 


1000 

"23~ 



TC 


1000 

~29~ 

:63。 



7 T 


1000 

"IT 


TC 


(31) 

2 


+ 


TC 


( 10 ) 

2 


24 + 21 



16 



15 



14 + 11 



11-55 + 



c ) 提示的恒等式简单指出，一个岛幸存者是非巧的倍数的岛幸存者。显 


然， /( N 3 ， N ) 




应用这个恒等式直到达到项 /(： c ，巧）为止，其中或 


者 i 


0,或者 x < N 2 ; 结果是 


N — 1 


f ( N \ N ) 


2" ⑷/ 


k—l 


N 

~k 


k(N) 


，1 l _ 2 2 


N 3 




1N/ ^ <N 


kpj 


:，岛一 L [焱是 


木 



; 幸存者] 


现在 /(X ，1) 




U 」， 所以当 N 


10时，头一个和是 1000 - 500 - 333 - 200 



166 - 


142 


一 9。第 


个和是 


广 /1000 ^1000 ^ ,/1000 n \ r /1000 

， I ’ 1 I ， 1 _/ i ’ 2 — ， i ， 2 _ 


21 
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/1 QQQ 
35 



-100-71 -33-24 -9= —237。因此 /(1000 ， 10) 二 —9 + 237 = 228, 


且冗（1000) 二 4 + 228 - 1 -63 = 168。 

d ) 如果 N 2 <2 -我们可以构造一个数组，其中，对于 


曰 



Pj 幸存者]表示在7次扫描之后的筛，而且对于1<72<2 


m 


a 


n 


a 


2 n 



a 


2；2 + 1 ° 


于是 


当 x < N 2 时容易在 0 ( m ) 步内计算 / U ， 岛)，并且在 O ( N 2 m // 0 步内从筛中删去 p 
的倍数。计算 /( iV 3 ， iV ) 的总共运行时间将成为 0( iV 2 log/Vlog log iV )， 因为 

Pj = 0 (log log N) 0 

如果我们把筛分成为大小为 / V 的 iV 个部分，而且在每个部分分开地工作，则存 
储要求可以从 2 N 2 m 降低到 2 iVm 。 在主计算开始之前，对于岛的辅 

助表和对于 以及 k 的最小素因子的辅助表是有帮助和容易构造的。 


[ J / ilMaf / i . Comp 


(1985) 




560 


O 


Meissel 引入的， MaA ■ Armaien 2 (1870) 


个类似的方法首先是由 D . F . E . 
642;3(1871)，523〜525;21 (1883), 
304 ;25 (1885) ，251 〜257。 D . H. Lehmer 在 Jiiinoi.s 3 ( 1959 )，381 〜388做 

了若干改进。但无论是 Me 1 S sel ， 还是 Lehmer 都没有像上边所描述的方法那样有效 
的对于递推的一个停止规则。 Lagarias 和 Odlyzko 也建立了一个完全不同的方法， 


由此利用解析数论原理，可以在 0( JV 1/2 + <) 步内计算 7 t ( N ) 0 后一个方法已经被用 
于目前的世界记录的素数的计算，它是由 Del6gUse 和柘 vat 得到的 ， Ma A Comp . 65 

(1996),235 〜 245 ; tt (10 20 


2220819602560918840 c ] 


[初始化]求 f 使得 


1 (modulo s ); 然后置 




mod 





r 


mod 


S J V 




汐 1 ，。3) 




S y W 
(OyV) 


(n 


rr ) r/s mod s ， N/s j y ( u ly u 3 ) 


(1， 


u 


O 


(我们要求所有的整数偶 （ A ，/ /) 使得+ r )( jus 



r 


iV ; 这意味着 Az / 





w(modulo O ，且7我们将以抑制掉 t 2 yu 2 , 


M 来执行算法 4,5.2 X ; 关系 


Xt 





zvt 


l ^ 


Xu 





U)U l y Xv 





U)V\ 


(modulo 5) 


将保持不变。) 


L 2. [试验因子]如果 




O 


0,则每当 A5 + r 整除 iV 和时，输出 ； U 

+。 


如果巧= 0 ,每当 P + 〆 整除 N 和时输出 N/(p 


U)V\ 


否则，如果力<0,对于所有使得 
有使得0< WT ；! + 的々，以及对于 

+ ^3^ + Vi〆） 2 -4 viv 3 N 是完全平方，而且如果数 


ks \<： d 的々，或者如果％>0,对所 


和- 1 ，如果 



( 


VOV\ S 



zvvy s + ks L — t；3 r + r 7 + 


A 


a 


4d 


TJUV ] S + ks 



2 叩 








r - g ^fd 


2 叩 


是正整数，则输出； b + r 。 （这些是对于 At ; 3 



flVy = ZVVi ks y (Xs + r )( JUS 




1 


N 的解。) 
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题答案 


L 3 .[完成了吗？]如果^3 = 0,则算法 结束 0 

. L 4 .[除和减]置 q ^- lu 3 lv 3 jo 如果 w 3 = W3 , 且 W <0, 则 （？ 减1。然后置 

(“ “3) —( W i ， W 3) _ ( 9， （ …， W 3 ) —( W ，。3)， （ ，。3) — ( “ “3) 

并返回步骤 L 2。 ■ 

[参见 Ma A Comp . 42 (1984) ， 331 〜 340。 步骤 L 2 中的界可以更精确化，比如 
确保^>0。某些因子可能输岀一次以上。] 

43. a ) 首先确保雅可比符号为+ 1。（如果它为0,则任务是简 单的； 如果它 
是 - 1，则 ： y $ Q w 。）于是在 [0 ， m ) 中选择随机整数: r 】 ，…，: r „ 并令 X」= [G (: y 2 : r / 

mod m ) = ( yXj 2 mod m ) mod 2 ] 。如果 ； y G ，我们有 EX ; + (; 否则 m — y ^: 

如果 A + … + 报告 K Q 一 由习题 1.2.10-21， 出 

错的概率至多为 e _2<2 ' 因此我们选择 n ^[^- r 2 \n t 1 ]。 


b ) 求使雅可比符号 


X 


m 


- i 的一个 a 、 并置 y 


x 2 mod m 


于是 m 的素因 


子是 gcd {x + ^/~ y ，: m ) 和 gcd ( j ： 


V ^， m )， 所以我们的任务是当给定 y eQ m 时求 


如果对于任何非零的我们可以求⑺，则我们完成任务，因为6 
mod m ，除非 gcd ( r ， m ) 是 m 的一^个因子 o 


V 


TV 


假定对于某个 

知道二进分数 a Q 和 ft ) 使得 


2 


e 


。在 [0， m ) 中选择随机整数 a 和6,并且假定我们 


ra 


m 


«o 


< 


64, 


rb 


m 


A ) < 


64 


这里是 "64 的奇数倍，而汍是 


6 


/64的奇数倍 


0 


还假定我们知道 Aa 和 A 6 


然我们并不真正知道 a 0 ^ 0 , Aa 和从，但我们将尝试所有 32 r ! x 32. 
能性。程序的虚假分支是在不正确假定之下运行的，但不会引起损害 


。当 

的可 


o 


定 义数… 


2 


a 



i + 




2 


b 


mod 


m 


和 


v 


tj 


2 


- l 


(a 十 jb )mod /n 0 和 


〜两者都在 [0 ， m ) 中一致分布，因为 a 和 6 是随机选择的 


其次，对于固定的 


，对 


于 



Z ， 数… 是成对独立的 ，而且对于 Jo ^ j<Jo 



/，只要 Z 不超过 m 的 


最小素因子数，％也是成对独立的。我们将仅仅对于 


-2 




-2 


来利用 W 


和 


V 


如果这些值当中有任何一个与 m 有非零公因子，则我们就完成任务了。 


对于所有 r 丄 m ， 如果 …我 们定义 p 


+ 1，如果-1；6 0^我们定义 


yv = _ 1 ， 而如果(土 ) = - 1 ， 则 p = 0。注意 + 2)j = ，因为〜 = 

八 \m j 

(2 2 u 0 + 2 ),) mod m 。 因此通过对 0< t < l 和 -2, 2 < j <2"— 2 应用算法 A 到％ 
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和乂，对于所有的？和 j 我们可确定置& = 1 于该算法中将确 


保所有的 x 值以大于等于1 


的概率正确 


O 


这个算法至多工作 r 个阶段。对于 0< Z < r , 在阶段〖开始处，我们假定知道 
A 2 — k ， A 21 以及分数〜， ft , 使得 


zl^a 

— a 
m 


< 


2 



之 + 6 ， 


rl^b 


m 


A 


< 


( 


2 


+ 6 


定义〜 + 1 = 士 （〜 + A 2 D 和 p t + x -~( p t + X 2~ l b ) ; 这保持这些不等式。下 一 步是 
求满足 


Xu tJ 



A 2 一 k + jX 2 ~ l h + A 2 


— 1 


b 



t 2 ’a 十 jz2 L b + t2 


卜 l 


b 


m 


0( modulo 2) 


的； 12 


-1-\ 


b 


令 


n 


4 min ( r ，2 z )f — 2 ; 于是当 




n 


2 


时，我们有 


r 2 一， 


a 



m 


m ' t2 — 卜 1 b , 

+ — \ a 



m 


m 





A 


+ 1 


因此如果； = 1 则有可 


< 




16 


-/ -1 


b 


G , ，其中 G , = ( G ( u 2 f1 y mod m 



A 2 


a 



jX 2 ~ L b + + ft + 1 J ) mod 2。更精确地说，除非 

否则我们将有 


或 tu tJ > 


1 - 


(: 


\ 


16 


m ， 


1( t 2 l a + jz2 L b + t2 十 1 b)l m ] =ia t + jp t + h 

令 V ) = (2 Gj - 1) xu tJ o 如果 K = 十 1 ， 它支持 A 2 —' —4 = 1; 如果 K = + 1 ， 它支持 
A 2 _〃V = l ; 如果-1，它支持义21 — 1 6 = 0;如果 （=0, 它就弃权。我们将是 
民主的，因此置 X2 ^~ [ b = [ S ； L 2 ：!,/ 2 y ；> o ]。 

H L V 是正确的概率是多少？如果尹0且 （ m 或> 

l 1 _ ^) m 或 mod m )#； lw 0 ) ，则令4 = - 1;否则令 = I p J 。由于 2^ 

是％的函数，随机变量 & 成对独立而且有相同分布。令 z = S ； L 2 ： i /2 如果 

0,则 X 2- l - x b 的值将是正确的。 Z y =0 的概率是 1/2， Z ; = +1的概率 + + - 

Li" 

f ; 因此寻〜显然士。所以在有正确假定的程序的分支中出错的 

机会，按照切比雪夫不等式，至多是 P r U <0)< P r ( UiE 4) 2 > gnV)<|^-V 

] 16 9 

= 吾 min ( r ，2’) _1 0 


以 〜 代替〜的一个类似的方法可用来确定义2~-^且误差 glrnmCrT 1 

y 
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习题答案 


最终我们将有 ？/2 〃 6 < l /(2 m )， 所以将是最接近于的整数。于是我们 
可以计算 ^ = (2% M r2 -%) mod ttz ;把这个量平方将告诉我们，我们是否正确。 

在 t<\g n 的诸阶段中，出错的总的机会以普^^-，二 I ■为上限，而在随后的 

阶段中出错的总的机会以 = | ■为上限。因此总共的出错机会，包括％的 

值不全正确在内，至多是音+音+点 = 各。在寻求的过程中程序的所有运彳了的 

至少 丄是成 功的。因此平均说来，在重复这个过程至多10次之后，就将找出 m 的 


因子。 

对于％的计算，总共的运行时间受 OU - 4 log ( n - 2 ) T ( G )) 的支配，加上用于 
随后猜测的 0( r 2 厂 2 了（0)，再加上在所有分支中用于计算 a ,,/?,, A2 ^ a 及 A2 _% 

的 0( 厂 2 r 6 )。 

这个过程很精彩地描述了随机化算法的许多基本范例，是由 R . Fischliii 和 
C . P . Schnorr [ J . Cryptology 13( 2000 )，221 〜224 ] 给出的。他们从 Alexi , Chor , Gol - 
dreich 及 Schnorr [ S/COMF 17(1988) ,194 〜 209] 和由 Ben _ Or，Chor 和 Shamir[STOC 

15 (1983),421 〜 430] 较早的方法导出了这一过程。当我们把它同引理 3.5 P 4 组合 
在一起时，我们得到类似于定理 3.5 P 的一个定理，但以序列3.2.2-(16)代替 3.2.2- 
(17)。 Fischlin 和 Schnorr 说明如何把这些计算流水线化使得它们的因子分解算法 
花费 O U^logU — 1 ) T ( G )) 步； 得到的用于“击破 ”3.2.2-(16) 的时间上限为 
T ( F ) = OiRN ^^ logiRNr ^ iTiG ) + P 2 ))。 由这个 O 所隐含的常数因子是较 

大的，但并没有错。如果我们能以大于等于 备 + e 的概率猜测 y /a mod 2,则当《丄 


p ( m ) 时，一个类似的方法可从 RSA 函数 j = ^ 求出 工来。 


44. 假设对于 Ki<k = d(d _ 1)/2+ 1， S ; 


d I 


o A〆 


0 (modulo mi ), gcd ( a i() 


a n 


馨 《 籲 


mm m 


， a 心-丨〉，叫 ）=1 ，且 I x I < m , ，其 中对于 < jd 叫丄％。还假定 m = 

> n nll 2 n /2 c^， 其中 n = d 十 々。首 先求 uy …， u k 使得 mod m 


饥 k 




L 


然后建立 

. n X n 矩阵： 


， M 

0 

• 

_ 

mM 

• • 

# • 


• 

0 

• 參 

o … 

m d ~ l M 

aio w i 

ma u uy … 

^ 1 a l(d-l) u 1 

<^20 u 2 

• 

ma ll u 1 … 

i 

m d ~ l a 2{d - l) u 1 

■ 

m 

■ 

■ 

• 

參 

d — 1 

、 a k0 u k 

ma kl u k … 

饥 ^k(d~ 1 ) 


\ 


Ml 


m 


d 


0 


Ml 


m 


d 


0 


0 


ft ■暑 


Ml m k d 
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其中对角线以上的所有元素都为零，因此 detLsM ” -1 ?^ -1 


d 
d 
令 


- k 


现在令 


(tQy 


td-\y^ 


) 是长度 dX/iM 


m 


(k-\)ln 


- kin 


的 


个非零整向量。由于 M 


n - \ )j n 


<Ml 


m 


kin 


C 


；M + ] a i ju i v i 和 P (: r ) = cq + cj x + 


蠡 # 



，因此我们有长度 （ wLKM / d 。 

— 、于是对于 


P ( x ) = Vi ( a ； o + a 2 i x 十… + a-^ d ~\) X d 1 ) =0 (modulo tt ?」）； 因此 P (x )=0 (modulo 

M )。 还有 | m 七 |< M / d ; 由此得出 P (： r )=0。 但 PU ) 不恒等于零，因为条件巧％ 

三0 (modulo m ; ) 和 gcd ( a z0 ，… a 心 - 0 ， m t ) = 1 意味着 ％ EQ ( moc i u lo 肌, ） ，而 | v t Ml 

m { d I < Mld 意味着 I % I < ; 我们不可能有％ = … % = 0。因此我们可以求出 

x ( 更精确地说，是对于： c 的至多 d -1 个可能性），而且总共的运行时间是 lg M 的 
多项式。 [Lecture Notes in Comp. Sci. 218 (1985)，403 〜408。 ] 


45 . 事实 1 —个解总存在。首先假设是素数，如果 ) = 1则对于 j = 0有 

\ ri / 

一 个解。如果^卜 _ 1，令 7 _ >0是使得我们有= - 1的极小值；于是对于 

某个工 0 和 y 0 , xl ~ a = ~ ja 和6 三- 风 y 0 2 (moduio n ) ， 因此 （ x 0 y 0 ) 2 - ay \ = b 0 其 

次假设我们已经找到一个解 jc 2 - = 6 (modulo /z )，而我们要把它扩充成模 rz 2 下 

的一个解。我们总可以求出 c 和使得 （x + cn ) 2 ~ a(y + dn) 2 = b (modulo n 2 ) , 

因为 （: r 十 cn ) 2 - a(y + dn ) 2 = x 2 - ay 2 + (2cx ~ 2ayd ) 72 和 gcd(2x ，2<^ ) 丄 n o 因 

此当 n 是一个奇素数的幂时 ，一 个解总存在。（我们需要 假定〃 是奇数，因为例如 
对于 x 2 ±/^3 (modulo 8) 来说没有解。）最后，由中国剩余定理，对于所有 奇数； z ， 
一 个解总存在。 

事实2给定 a 和 n 且 a 丄72,解的个数和所有6丄 n 相同。这由提示的恒等式 
和事实1得出，因为如果 x \ - ay \ = b ，则当（: c 2 ，力 ） 取遍 x 2 - ay 2 ^ l 的所有解时 

( x { x 2 - ay l y 2y x l y 2 + 取遍 工 1 - ay 1 三 b 的所有解。换言之，当 _ 町?丄 ？2 

时，（工 2 ， y 2) 是由（: ci ，： Vi ) 和（: c ，: V )惟一确定的。 

事实3给定整数 （a ， s ，^)使得 z 2 = a ( modulo s ) ，我们可以求整数 （n m ， 

Z ) 使: c 2 _ ay 2 = m 2 st ，其中 （ d )#(0,0) 且 - | a |。 因为如果 z 2 = a + 而，令 

“，是极小化（加十 mt ;) 2 十 | a I u 2 的非零整数对。使用 3.3.4 小节的诸方法，和 

, / A \ 1/2 

由习题 3.3.4-9 的十 mv ) 2 + || a | ，我们可以有效地求出 U ， t ；) 。 


因此 （ w 十 mt ;) 2 - aw 2 =加，其中 t 1 ^ 


4 



a 


o 


提示的恒等式现在解决了: c 2 -^ 


2 


(ms ) ( mO 0 

事实4容易解： c 2 -》 2 三& (modulo 72 ) ， 因为我们可以令 X = (6 十 1)/2, 3 / = 
(b - 1 )/ 2 。 

事实5不难来解： c 2 + y 2 = b (modulo n ) ， 因为习题 3.3.4-11 中的方法，当 p 
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是素数和 p mod 4=1时可解：£2 + 3^= />;数 b，b + n，6 + 2?7, …之 一 '将 是这样 一 个 
素数。 

现在当 U | >1时来解所述的问题，我们可进行如下。在1和〃 -1 之间随机地 

选择 w 和 w ，然后计算 uu — { u 2 - av 2 ) mod w 和 d = gcd ( zv y n ) 0 如果 或 

如果 g C d ( m )> l ， 我们可以减少 77; 用于证明事实 1 的方法将把对于〃的因子的 

解提升成为对?7本身的解。如果 d = 72和 W 丄77,我们有（2//^) 2 三^( modulo /? ) ，因 

此我们可以把 a 减为1。否则 d = l ; 令 s = bw mod no 由事实2，数5在与 n 互素 
的数当中一 '致 分布。如果 = 假定5是素数，尝试来求解 z 2 = a (modulo 5 ) 

(习题 4.6.2-15)。 如果不成功，则以 w 和 w 的另一个随机选择重新开始。如果成 
功，令/ + 并计算 d = gcd ( ms ，72)。 如果3>1，像前面那样简化这个问题。 

否则使用事实3来求有（ 2 <^^|的？-町 2 =7^ ; 这使得（：^) 2 -^3；/770 2 三 

^(modulo n) 0 如果 r =0, 把 a 减为 1。 否则就递归地应用这个算法求解 X 2 - tY 1 

(modulo n) 0 (由于 Z 比 a 小得多，因此将仅仅需要 0( log log ?? ) 级的递归。）如 
果 gcd ( Y ， n ) > 1，我们可以减少 n 或 a ;否则 （ X / Y ) 2 _ a ( 1/ Y ) 2 三 r (modulo n ) 0 

最后，提示的恒等式产生对于 jc /2 - ay /2 = s 的一个解（参见事实2)，它转而导致所 
求的解，因为 u 2 - av 2 = si b o 

实际使用中，在本算法中所做的关于素数的假设证明为真之前，仅需要 0 (bg n ) 
次随机试验。但一个形式的证明将要求我们假定推广的黎曼假设 [/£：£：£： Trans . IT - 
33( 1987) ， 702 〜 709 ] 。 Adleman，Estes 和 McCurley [ Math . Comp . 48 (1987)，17 〜 

28] 建立了一个较慢且更复杂的算法，它不依赖于任何未被证明的假设。 

46 . [FOCS 20 (1979)，55 〜 60] 在对于足够的〜求出 a ' mod Z 

后，对于 Kj Xm 我们可以对整数:求解 + ( p ~ 1 ) t jk = 心（例如， 
像在 4.5.2-(23) 中那样），由此知道对于 a ' mod p = p j 的解 iV ; = (S wwJmod ( p 

_ 1) o 于是如果 6 a ” mod p = D ./= i ) ，我们有 n + n ’ 三 2/^ i e'jNj (modulo p ~ 1) 0 

[已经知道一些改进了 的算法，例如 Coppersmith ， Odlyzko 和 Schroeppel jAlgorithmi - 
ca 1(1986) ，1 〜 15 0 ] 

4.6 节 

1 . 9 jc 2 + 1 x + 7； 5 x 3 + lx 2 + 2 x + 6 0 

2 . ( a ) 为真。 （ b ) 如同在习题 1 中那样，如果代数系统 S 包含零因子，即其乘积 
为0的非0数 ，则 为假； 否则为真。 （ c ) 当 m 竽 n 时为真，但是一般地当 m = n 时为 
假，因为前导系数可能消失。 

3. 假定 r ^ 5 0 对于极大值是 m ' m2(k + 1); 对于它是 

mtmaCr + l ); 对于 + 它是 + s + 对于所有 &有 效的最 
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小上限是 m 1 ? n 2 (r + l)o (解答本习题者将知道怎样分解多项式工 7 十 2 x 6 十 3: r 5 十 

3 工 4 十 3:c 3 + 3 x 2 + 2 工十 1。) 

4. 如果诸多项式之一有少于 V 个非0的系数，则通过在每两个系数之间放置 
Z -1 个0即可形成乘积，然后在二进数系中相乘，最后使用一个逻辑 AND 指令（在大 
多数二进制计算机上都存在，参考算法 4.5.4 D ) 把多余的位数化成0。例如，如果 z 
= 3,则正文中的乘法将变成 （ 1001000001 ) 2 x ( 1000001001 ) 2 = 

(1001001011001001001) 2; 如果我们以常数 （1001001 …1001 ) 2 AND 此结果 ，就 得到所 

希望的答案。类似的技术可用于乘非负系数不太大的多项式。 

5 . 次数 <2 n 的多项式可表示成 U i ( x ) x n + L / o ( z )， 其中 deg ( L /! X 72 和 

deg ( L/ 0 Xw ; 而且 （[/!( 工）工” + U 0 ( x ))( V x ( x ) x n + V 0 (x )) = U { ( x ) Vi ( ) ( x ln 

x n ) + ( U { ( x ) + Uq ( x))(V { ( x ) V 0 ( o :)) j : /, + [7 0 ( jt ) V 0 (： t )( x ” + 1 ) o (该式 

假定算术是在模 2 之下进行的。）于是等式 4.3.3-(3) 和 4.3.3-(5) 成立。 

注： S . A . Cook 证明了可以类似的方式推广算法4 J .3 T ， 而且 A . Schonhage [ Ac - 
ta . Informatics 7 (1977) ，395〜 398] 已经说明怎样仅用0 ( n log n log log n ) 个二进 
位运算来乘多项式 mod 2。事实上，任何环 S 上的多项式都可以仅使用 OU Log 

nlog log 幻个代 数运算来乘，即使当 S 是一个其乘法不必是交换的和结合的代数系 
统时 [ D . G . Cantor 和 E . Kaltofen , Acta Informatica 28 ( 1991 ) ， 693 〜 701 ] 。 参见习 

题 4.6.4-57 和4.6.4-58。但是这些思想对于“稀疏”多项式（大多数系数为 0) 来说 

不是有用的。 

4.6.1 小节 

1. q { x ) — 1 # 2 3 j: 3 + 0 • 2 2 j: 2 — 2'2 x + 8 = 8 a : 3 _ 4 :c 十 8; r { x ) — 28 x 2 + Ax + 8 0 

2. 在欧几里得算法期间产生的首一多项式序列有系数（1，5,6,6，1，6,3)，（1， 
2,5,2,2,4,5)，（1，5,6,2,3,4)，（1，3,4,6)，0。因此最大公因子是： c 3 + 3工 2 + 4工 + 

6。（一个多项式和它的逆的最大公因子，在是它自己的逆的一个单位倍数的意义 
下，总是对称的。） 

3. 算法 4.5.2 X 的过程是正确的，其中以 S 上的多项式代替了整数。当此算法 

终止时，我们有 U ( jo ) = u 2 ( jo ) > V ( x ) - u ^{ x ) o 设 奶二 deg ( u ) ， n 二 deg ( ) 。 用 

归纳法容易证明，假定爪>72，在步骤乂3之后整个算法执行期间 ， deg U 3 ) + 

deg ( vj ) = n , deg ( w 3 ) + deg ( = m 。 因此如果 m 和 rz 大于 d = deg ( gcd ( u y v )) y 

则我们有 deg ( U ) 〈 m - d , deg ( V ) < n - 精确的次数是 m 和 72 -心，其中 
d x 是倒数第二个非 0 余式的次数。如果 d = min ( m ， n ) ， 比如说 d = n ，我们有 U 
( x ) = 0 和 V ( x ) = 1 0 

当 u ( x ) = x m — 1 v { x ) — x n - 1 曰寸，恒等式 （ — 1 ) mod ( x n — 1 ) = x m mod n 

-1 表明，在计算期间出现的所有多项式都是具有整系数的首一多项式 。当 uU ) 

=上 21 _ 1，幻(工） = ：1： 13_ 1 时，我 { 门有 V { x ) — + x 8 + j： 6 + 0 (? + 1, U ( x ) = 一 (工 19 + 

^： 16 + j ： 14 + x 11 + j ： 8 + j ： 6 + j ： 3 + a ：) o [也见等式3.3.3 _ (29);它给岀 / 对于 [/( z ) 和 
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VU) 的另外一个公式。还可参见习题 4.3. 2-6,其中以 x 代替2。] 

4. 由于商 g (: r) 仅仅依赖于！；（工）和^(工）的头772-;^个系数，因此余式 r ( x ) 

== w (: r ) - g (: r)t; (: c) 是一致分布的且与 u(:c) 无关。因此这算法的每一个步骤均 
可以认为同其它步 无关； 这个算法比整数上的欧几里得算法有好得多的特性。 

n ^ n - k 的概率是〆 —（l-1/f )，而且 （= 0 的概率是 p — n 0 实质上，往下的 

每一步有相同的 特性； 因此我们可以看到，任何次数 n ， ni ，…， n ( ， _ oo 的序列以 

- \) l \ p n 的概率出现。为求 /U: ，…， n,) 的平均值，命&为 /(〜 ，…， 〜）在所有有 

着 Z 的给定值的序列77 >〜> … >72,>0上的和。于是平均值是 

命 /( ni ，…， n J =〖，则 S c - ，所以平均值是72 ( 1 - 1/p ) o 类似地，如果 

W / 

/( Tl ! ，…，％) = TZi +…+〜，则 — I〆 同时它的平均值为 “/I — 1/ 

p 、 。最后如果 f ( n { ，…， n t Xn - 〜）"！ + ••. + ( n t - l - 〜，则 S, = 

(“1)卜 + 1 卜卜^1，而且平均值是(\ +1 卜（”十1)/^ — 1) + (/^ 

W +1 / \' 2 i \ t I \ 2 / 

-l)) 2 (l-l/， + I ) 0 

(通过置 S, = [ ( = n ] 得到的对于 = n , n J + l = rij ~ 1 的概率是 （1 _ 1/ 

p)' 所以当 0 — ⑺时这个概率趋近于1。作为一个推论，我们对于正文中的下述断 
言有了进一步的证据，即算法 C 几乎总求出心= 6 =…=1，因为对于所有的 pM 

P 下不能通过后面条件的任何多项式也将不能通过前面的条件。） 

5. 利用习题4提供的公式，且/(心，…， 72,) =[〜=0]，我们求得如果72 >0,概 

率为如果72=0,概率等于1。 

6. 假定常数项 w(0) 和1；(0)非0,想像一“自右到左”的除法算法， W(x) = v(x) 
m q(x) 十 (: r)， 其中 deg ( r ) < deg ( ^ ) o 我们得到类似于算法 4 • 5 • 2B 的一个 
gcd 算法，它实际上就是把欧几里得算法应用于原来输人的“逆”（参考习题2)，然后 
对答案取逆并乘以： r 的适当乘方。 

有类似于习题 4.5.2-40 的方法的一个类似的算法。 G.H.Norton,SJCOMP 18 
(1989),608 〜624; K.Ma 和 J . von zur Gathen, J . Symbolic Comp. 9 (1990) ,429 〜 

455 已经求出这两个算法的平均迭代次数。 

7.S 的单位（作为0次多项式）。 

8. 如果 w (: r) = i(:c)u;(x)， 其中 w(:c) 有整系数而 T； (: r) 和 w(:c) 有有理系 
数，则有非零整数 m 和”使得 TTHU ) 和77 •wU) 有整系数。现在 〃（: O 是本原 
的，所以等式 (4) 意味着 

u(x) 二 pp( ( m • v(x))(n • vu(x))) = ± pp( w • v(x))pp(n • vo(x)) 

9. 我们可以扩充算法 E 如下： 设（心 （1)，wU)，W， 〜（工 ）） 和 （W ( 工）， 

t ；2( 工）， 是满足关系式 ^ l (^) w ( x ) + Ui { x ) V { x ) — U ^ U 4 ( x ) , V I { X ) 
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u ( x ) + v 2 ( x ) v ( x ) = t ; 3 t ; 4 (: c ) 的四兀组。扩充的算法以四兀组 （1,0, cont ( u ) ， 

pp ( w (: r ))) 和（0，1 ， cont ( I ；)， pp ( t ； (: r ))) 开始，而且以保持上述条件这样一种方式 
来处理这些四元组，其中 w 4 (： t )， w 4 ( j :) 跑遍算法 E 中 w ( x ) 和 r (: c ) 所跑遍的同样 

的序列。如果 au 4 ( x ) = q ( x ) v A ( x ) + (: r ) ，则我们有 a % ( u x ( x ) , u 2 ( oc )) - 

g (:?:)- 2 / 3 ( 1 ； 1 (:?:)， 1 ； 2 (工）） = (厂 1 (工），厂 2 (工）），其中 r x ( x ) u ( x ) + r 2 ( oc ) v ( x )= 

〜 3 t ； 3 r (: r )， 所以扩充的算法能保持所希望的关系。如果 Wx ) 与互素，则扩 
充的算法最终能找到0次的 r (: r )， 而且如同所希望的那样，我们得到 U ( x ) = r 2 

( x ) , V ( x ) = r l ( x ) 0 (实际上，我们将以 gcd(cont (厂 ! ） ， cont ( r 2 )) 来除 r x ( x ) , r 2 

U ) 和 bu ^ v ^ o ) 反之，如果这样的 L / U ) 和 V ( x ) 存在，则 w ( x ) 和没有公共 

的素因式，因为它们是本原的，因而没有正次数的公因子。 , 

10. 通过逐次地把可约多项式分解为较小次数的多项式，我们必然得到把任何 
多项式化成不可约多项式的有限因子分解。内容的分解是惟一的。为了证明至多 
有一^个本原部分的因子分解，关键之点是证明：如果 w (: c ) 是 t ; (: r ) w ) 的一^个不 
可约因子，但不是不可约多项式 Wi ) 的单位倍数，则4工）是 W (: r ) 的一个因子。 
注意由习题9的结果 w ( x ) 是 v ( x ) vu ( x ) U ( x ) = rvu { x ) ~ w (: r ) w ( x ) V (: r ) 的 一 

个因子，其中 r 是一个非零常数，即可证明这一点。 

11. 所需要的行名仅为 A 1 , A 0 ^4， B 3 , B 2 , B 1 , Bo ， C 1 , Co ， Doo —般来说，设 

义 + 2 U )=0 ; 则对于这个证明所需要的行是 A „ 1到 Ao , 氏到馬，心到 C 0 , 

1 J 1 ； 2 ； 

D n - „ 到 D 。 ，等等。 

3 j 

12. 如果仏=0,正文中 （24) 的证明表明，行列式的值是± /4,而且这等于 

如果多项式有一个正次数的因子，则我们可以人为地假 
定多项式0的次数为0并使用对于4=0的同一公式。 

注： Sylvester 的行列式的值只 U ， r ) 称为 w 和 t ; 的结式，而且量 
(- l ) deg ( w )( degU ) _ 1)/2 / U )— 1 只 U ，/) 称做^的判别式，其中/是 W 的导数。如果 
u ( : c ) 有分解的形式 a{x ~ a x )'' l (x - a m ) ，而且如果 t ;(: c ) 二 b(x ~ 仏 ）… （:r — /?„) ， 

则结式 r ( Uj v )^ 。、（叫卜1(0 = ( - i ) mn b m u (/^) … u (扎）= a ^ nr = in ； =1 

(- /? ; ) o 由此得出，分别作为 u(y - x 、， u(y + X) ， jc m u(yl X )及 u(yx)tf] v { x ) 

的结式定义的 y 的772/2次多项式，它们的根分别是和 +民，差 a t _氏，积 afij 和商 

心 / ft (当 W 0) 参0时）。这一思想已由 R . G . K . Loos 用于构造代数数算术运算的算 
法 [ComputingSupplement 4 (1982) ，173〜187 ] 。 

如果用 （6 oA 7 + + …+ 心 - i ) - ( a 0 B t + 〜汉 +! + …+ — 卜; • 

^2 2 

B n 代替 Sylvester 矩阵中的每行 A z ， 而后删去氏 - 丨到仏诸行和最后的 n 2 列， 

2 2 

我们就得到结式的 〜 x ni 的行列式，而不是原来的十 n 2 ) x ( ni + n 2 ) 行列式。 
在某些情况下借助于这个行列式，可以有效地计算结式，见 CACM 12 (1969),23 〜 
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30,302〜303。 

J.T.Schwartz 已经证明，当 w — °°，总共用 O ( ^ (log tz ) 2 ) 次算术运算，有可能 
计算 n 次多项式的诸结式和 Sturm 序列 。 [JACM 27 (1980) ，701〜717。 ] 

13. 对 j 用归纳法可以证明，对于 7 >2，（~ + 1 (：0，& + 1 ，/1 ; )的值分别为（^ + 卜 

w ( x ) Uj ( x ) y £ 2+ p jgj , 产也) 所代替，其中 pj = n ' + [无论这个增长是怎样 

的，上限 (26) 保持正确。] 

14. 设0是这个环的一个素数，并设_;，々是使得 〆 \ v n = £( v ), p J \ 〜 ^的极 
大值。设尸二 〆 。由算法 R ， 我们可以写 g (:^) = <2◦ + J P (2 1 ：r + … + P s a ^ c s ，其中 s = 
m - 72 ^2 o 我们考察 w(:c ) g 1 ) 中 x n + l , x n 及: _ 1 的系数，即 Pa x v n + P 2 a 2 v n -\ 
+ …， a 。％ + PayV ^-^ +…及 a 0 ^„-i + Pa l v n - 2 + … ，它的每一个都是 jP 3 的倍数。 
我们从头一个推知夕\ q ，从第二个推知 \ a Q ，然后从第三个推知 P \ 

因此， P\r(x)。 [如果 m 仅是 n + 1， 我们可以证明的最好结果是整除 

r(:c); 例如，考虑 u ( x ) = j : 3 + 1 ， v ( x ) = 4 jo 2 + 2 x + l，r(:c) = 18。另一方面，以类 
似于 (21) 和 （22) 的矩阵行列式为基础的论证可以用来证明 /( r )deg(，)-deg(,)-l r(：c) 

总、是 £( v ) (degU) " degU))(degU)_deg(r) - 1 ) 的倍数。] 

15 .设 a ;1 + … + a in a ]n ; 我们可以假设，对所有 i ， c “>0 。 如果对于某个 

， c /; #0 ，则我们可以用 （c fl — tc n c itl — %„ ) 代替行 z_ 和列 i ，其中 r = c tj lcjj ; 

这并不改变行列式 C 的值，而且它减少了我们希望证明的上限的值，因为 c u 为 c lt - 

所代替。这样的替换可以系统地对增长的 z 的和来进行，直到对所有的 

4 = 0为止。[后一^算法称为 GrarrrSchmidt 正交化过程：见 Creile 94 (1883)， 
41 〜73 ; Math . Annalen 63(1907) ，442。 ] 于是 det( A ) 2 = det(AA T ) = c n …。 

16. 在任何一个惟一因子分解整环上的 d 次单变量多项式至多有 d 个根（参见 
习题 3.2.1.2-16b)) ; 所以，如果72 = 1，显然 I HA) | < 心。 如果72 >1，我们有 

/(工 i ，…， JC ”） = g 0 ( x 2 ，…， L (工 2 ，… ，工 „ ) + … + ( 工 2 ，…， 工„ ) ， 其中 

gk 对于至少一个 A 为非零。给定（: r 2 ，…，:^)，由此得出，除非办 U 2 ，…， ；） =0, 
否则对于 h 的至多 A 个选择， /(JCi ，…，: r„ ) 为零；因此 I r( Si ，…， ) \^ di ( \ S n 
~ d 2 )'' m ( \ S n I - d n ) + I S t I ( I S 2 I … I S” I - ( I S 2 I _ ) … （I S„ I - d n )) o 

.R • A. DeMillo 和 R.J • Lip ton，inf • Proc. Left ers 7 (1978) ， 193 〜 195 。 _ 

注：所述上限是最佳可能的，因为对于多项式/ ( ^：!, , x n ) = 

nU , -以|〜6 5 ; ，1<々<4，1< 7 <72丨。但是还有另一层意义，其中上限可以大大 
改进：令 /i ( Xi ，…， ) = /( &，…， ) 并令 / y + i (弋+ !，…，: C ”） 是在 fj ( Xj ，…， X n ) 
中&的一个乘幂的任何非零的系数。于是我们可以令 * 是/ ; 中&的次数而不是 
/中:^的（通常大得多）的次数。例如，我们可以在多项式 _ 3 j：i X 2 + ^2°° + 5 
中令 A = 3和心=1。当/的每一项都有次数时，这个观察确保 A +…十尤 

因此在这样的情况下当所有集合 S, 相等时概率为 
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r(S ， … ， S) I 〈工 

5 I 



如果此概率而且如果对于 50 个随机地选择的向量 （ A ，…， A ) ,/ Ui ，…， A ) 

结果是零，则 /Ui ，…，至少以 1-2^ G 的概率恒等于零。 

而且，如果力 ( A ，…， ) 有： rpy; + 1 ( + ! , ••• ，: ) 的特殊形式且~〉 0 ， 我们可 
以取4 = 1。因为当力 + 1 (巧 + 1 ，…， A) 关0时，: r ; 必为0。因此一个仅有 m 个非零 
项的稀疏多项式对于 j 的至少 n ~\g m 个值有 d^lo 

应用这个不等式到 gcd 的计算以及对于稀疏多变量多项式的其它运算是由 
R. Zippel 引入的， Lecture Notes in Comp . Sci . 72 (1979 )， 216 〜 226 。 J . T . Schwartz 

[JACM 27 (1980)，701 ~717] 给出了进一步的扩充，包括一个借助于模算术来避免 
大数的方法 ：如果 /的系数是整数，如果 P 是全部大于等于9的素数的集合，而且如 
果每当每个 G S, ， | /(h ，…，& ) | ，则对于 G P ， /Oi ，…， )=0 (modulo 

P) 的解的个数至多为 

ISJ … I S„ I I P I - ( I Sj I ~ AVhOSJ - d n ) ( \ P \ - logg L) 

17. a ) 为方便起见，让我们仅对 A = U，M 来描述算法。这些假设意味着， 

deg( Qjl L0 = deg( Q 2 ，且 deg( Q, )^deg( Q 2 ) 。如果 deg( Q!) = 0 ，则 Q〗 是一 

非 0 有理数，所以我们置 Q= Q 2 /Q 10 否则设 Q 1 = aQ 11 + ^Q 12 + r 1 ,Q 2 = aQ 21 + 
办 Q 22 + ，其中 n 和 r 2 是有 理数； 因此得出 

Q,U ~ Q 2 V = a ( Q u U ~ Q 2l V ) + b ( Q n U - Q 22 V ) + r , U ~ r 2 V 

我们必然有 d^Qu^degWD -1 或0^(0 12 )=€^(00 -1。 在前一情况下，通 
过考虑以 a 开始的最高次数的项， dWQnL；- Q 21 \0<3坪（0 11 ^/);所以我们可以 
以 Q u 代替 Qa ，以 Q 21 代替 Q 2 , 并重复这一过程。在后一情况下，类似地，我们可以 

用 （ Q 12 , Q 2 2) 来代替 （ Qi ， Q 2 ) 并重复这一过程。 

b) 我们可以假设 deg(L；)>deg( V)o 如果 deg (只） >deg( V)，注意， QW — 

Q 2 V = Q { R - (Q 2 - QiQ) V 有小于 deg( V)<deg( Q! R) 的次数，因此我们可以以 

尺代替并重复这一 过程； 我们得到只= Q / V+iT，L/=(Q + CT) V+iT， 其中 
d e g(iT )< deg(iO, 所以最终得到一个解。 

c) b) 的算法给出 V : = L/V 2 + i^，deg (尺） <deg( V 2 ); 由齐次性，尺=0且 L； 是 

齐次的。 

d) 我们可以假设 deg(V)<deg(L；)。 如果 deg( V) = 0，则置 W—L 7; 否则使用 
c) 来求 L /= QV， 使得 QVV= VQV ,( QV- VQ) V = 0。 这意味着 QV= VQ， 所以 

我们可以置 17— V， V—Q， 并重复这一过程。 

有关这一课题进 一^步的细节，见 P.M. Cohn, Proc . Cambridge Phil . Soc . 57 

(1%1)，18 〜30。表征所有使得 UV = VU 的串多项式的更为困难的问题，已由 

G • M • Bergman 所解决 [Ph. D. thesis , Harvard University , 1967 ] 0 
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18. [ P , JVLCohn ，7 >ansacdon of the Amer . Math . Soc . 109 (1963)，332 〜356。 : 

Cl •置以 l — — Z2 — Wi ' < ~ j z \ ^ 2； 2 

W i ^— ZV2^0 j n —0 o 

C 2• (这时习题中给 出的恒 等式成立，并且 uxV \— Uiv 2 \ v 2 — 当且仅当 Uy = 

0 。） 如果= 0 ，则这算法以 gcrd( v iy V 2 ) = V [y lclm( ^ R = 

-^2 V 2 终止。（由对称性，我们还有 gcld ( U l , U 2 ) = u 2 ,R lcrm ( U X , U 2 ) 

~ U l l W l = - [72*^2 o ) 

C 3 •求 Q 和尺，使得％ = Qt ； 2 + 尺 ， 其中 deg ( R ) < deg ( v 2 ) o (我们有 〜（ Qi ； 2 

+ iO = 以 2 以 2 ,所以 ( u 2 - u l Q ) v 2 = R / v 2 o) 

C 4. 置 ( te ；! , t £；2 y r W l yU )2， Zi ， Z 2， ZiyZ 2 yUi ， U 2 y Vy y v 2 )^{ zv \ - VUiQ , ZV 2 ~~ 

zv 2 Q ,iv l ,zv 2 ,z\,z / 2 yZ l - Qz\ ，之 2 — Qz2 , u 2 - U X Q y U l ,V 2 yV l - Qw 2 ) 和 
打 — 72 + 1 ， 转回 C2 。 ■ 

欧几里得算法的这一推广概括了以前所有推广中的大多数特性，所以它提供了 
对已经考虑过的一些特殊情况的新的认识。为了证明它是正确的，首先注意， 
deg ( z ； 2 ) 在步骤 C 4 时减小，所以此算法肯定要终止。在算法结尾时 ，〜是 Vl 和 v 2 

的公共右因子，因为 l ) n V ! 和 - = ( - 1广 V 2; 而且如果 d 是 K 和 

V 2 的任何公共右因子，则它必是 ^ iV 1 + ^ 2 V 2 = x ； 1 的右因子。因此 T^^gcrcK V l5 

V 2 )。 又若772是和 v 2 的任何公共左倍元，则我们可以不失一般性地假设 w = 

^ 1 = ，因为 Q 的值的序列不依赖于 R 和[/ 2 。因此 m = (- i )^(- W2 ^；). 
Vl = ( _ 1)"( W 2 Z '2) V 2 是 〆 i 的倍元。 

在实际使用中，如果我们仅仅要计算 gcrd( Vi ， V 2 )， 则可以免去计算 

U )2^\ y t W / 2 , Zi ， Z 2， z \, Z ’ 2 o 这些附加的量之所以加到此算法中来，主要是为了使 
它的有效性更易于建立。 

注：串 多项式的非平凡的因子分解，例如由这个习题给出的例子，可以从一些矩 
阵恒等式得出，例如有 


(a 

VI 



1 

- c 



/0 

\1 


1 \ /0 

—b / \1 


因为甚至当乘法不可交换时，这些恒等式都成立。例如 




(abc + a + c ) ( 1 + ba ) = (ab + 1)( cba + a + c ) 

(把这同 4.5.3 小节的“连项多项式”进行比较。） 

19•[参考 Eugene Cahen y Theorie des Nombres 1 ( Paris : 1914) ， 336 〜 338。] 如果 
存在这样一个算法，则由习题18的论证， D 是一个 gcrd 。 现在让我们把 A 和 B 当 
做一 2 nX n 阶矩阵 C , 其头72行是 A 的那些行，而其余”行是 B 的那些行。类似 
地，把 J ° 和 Q 组合成一个2” x ”阶矩阵只；把 X 和 Y 组合成一个 n X 2 n 阶矩阵 Z 。 
所求的条件现在归结为两个等式 C = RD，D = ZC 。 如果我们可以找岀其行列式为 
±1的2” X 2” 阶整数矩阵(7,使得 U ~ l C 的最后”行全为0,则只= ([/ 的头” 
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4.6.1 小节 


n),D = ( U ~ l C 的头 n 行），2=([/〃的头 n 行）解决了所求的 条件。 因此，例如 
可以使用下列的算法（取 m =2 n )： 


算法 T (三角化）设 C 是 mX ” 阶整数矩阵。此算法求 m X m 阶整数矩阵 [； 
和 V ，使得 UV = I ，且 VC 是上三角。（这意味着如果，则 VC 的丨行 j 列元素 
为0。） 

T1. [初始化]置 V — /，即 mX m 阶单位 矩阵； 并置 T — C 。 (在整个算 


法中，我们有： r = vc , uv =/ o ) 

T2 •[对 j 进行迭代]对于 7 = 1，2,…， min ( m ， n )， 执行步骤 T 3, 然后终止此 

算法。 


T3. [使列为零] 


实施下列动作0次或多次，直到对所有为0 为止: 


设是丨 + ，…，丁,~丨中有最小绝对值的非0元素。交换 T 和 V 

的々行和 j 行； 交换 U 的々列和 7 列。然后，在矩阵 丁和 V 中从第 z 行减 
去 L 丁^乘第 j 行，而且对于在矩阵 U 中加 z 列的同样倍数 


到第 j 列 


对于所描述的例子此算法产生 G 2 4 )= [I 



II 

\0 





^)o (实际上，在此具体情况 


下，任何具有行列式± 1的矩阵都将是一个 gcrdo ) 

20 . 通过以小的数 e 代替，来考虑习题 4.6. 2~22的构造可能有帮助。 

21 . 为获得一个上限，我们可以假定，当 m -72< l 时，算法 R 才被使用。其次， 
诸系数以 （26) 为限且 m = 〃。[事实上所述的公式是在实践中所观察到的执行时 
间，而不仅仅是上限。关于更详细的信息，参见 G . E . Collins ， J ° roc .!968 Summer In ¬ 
st . On Symbolic Mathematical Computation , Robert G . Tobey 编 （ IBM Federal Systems 

Centenl 969 年 6 月 ），195 〜 231。] 

22. 一个符号序列不可能含两个连续的0,因为是 (29) 中非0的常数， 

而且我们不能有“+，0, +”或，0, - ”作为子序列。 当 b = a 时公式 VU ， a )_ 
VU ，6) 显然是正确的，所以我们只须当6增加时检验它。多项式义（ I )有有限多 

个根，而且仅当6 遇到或越过这样的根时才改变。命： r 是某个（可能有好 
几个）％的一个根。当 b hXx ~ ^ 增加到 i 时，如果_;>0 ,这个附近的符号序列从 

“ +， 士 ，-，，进行到“十，0,-，，，或者从 “ - ，土，+ ”进行到，0,十”；如果尸0,它从 

进行到“0 ,-”，或从”进行到“0 , + ”（由于 z / u ) 是导数，当 u(xM 
少时 /(: r ) 为负）。于是 V 中的纯变化是 _ ~ C )。 当6从 I 增加到 : C 6时，类似的 

论证表明 V 保持不变。 

[ L . E.HeindelJACM 18 (1971),533^548 已经应用这些思想去构造用于分离 
一个给定的多项式 w (: r ) 的实零点的算法，它在时间上以 deg (〃） 的一个多项式和 
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log iv 为界，其中所有系数乂是满足 U , I < N 的整数，而且所有操作都保证是精确 


的。 


23 .如果 D 有 72 


1个实根出现于 w 的 n 个实根之间，则（通过考虑符号的变 


化 ） w ( X ) mod 有 n - 2 个实根位于 r 的 n 


1个根之间 


0 


24. 首先证明\ = 
的^的指数有形式 色 


s S f 


Sj-1 


s. 


2 


(1 -气，一!〉… 《 2 \ (1 — -气 ■ 


。然后证明 （18) 左边 


2 



Six ，其中 


曇 參 


在卜 1 + 1 _汐 2( 汐3 + 




汐 3 (1 - 8 2 )( S 4 + - 


m ■ 


+ Sj - ! + 1 ) _ ( 1 - ^2 ) '** ( 1 _ 2 )( 1 )。 




+ D - 

=1，因 


为可以看出它是与无关的，而且我们可以置 
， A ，…适用而且可应用于（23)。 


0等等。 


个类似的推导对 


25. w ,( x ) 的每个系数都可表达为一个行列式，其中一个列仅含和 


些零。为了利用这一事实，修改算法 C 如下： 在步骤 C 1 处置 g 


八 rO ) 和 / i — 0。在步骤 C 3 处，如果 /z 


0，则置 u x ) , v ( jc ) 


M — 


gcd (£ ( u ), 
( x ) lg，h — 


£( 


U 


Ig^g 




汽 lO , 并返回 C 2; 否则如同在未修改的算法中那样进行。这个新的初 


始化的效果仅仅是对于用义 U )/ gcdUU )，/( z ;)) 代替士 （ x ); 于是 A 

(28) 中将变成户 ;_5 。 


4 


在 


事实上，还可推出更多的东西。注意，对于 n >- 1，习题3中的算法计算 


deg (〜） 和 A 


± /?, 〆 工 ） 和 1 P 〜（: r ) 。令〜= deg ( q n ) 
现，对于尤-丄十6 = deg ( w )。 我1 

A- 2 意味着 p(x) = c(x)p n -i(x)^W 
我们能求出 c ( x ) 和 d ( x )， 使得 p ( x ) 


deg ( p n u 


q n v ); 我们在习题 3 中发 


deg ( w ) 0 我们将证明条件 deg ( g )< 〜和 deg (_ 


qv )< 



(x ) 


^(:^〜-“:^:给定这样的 p 和 g ， 




c ( x ) p n - i(x 



(: c ) p ”（: c ) 和 q (x 


X 


)〜-l ( 工 ） + d ( 工）〜 （ 工 ） ，因为 pn-\^oc) q n ^x) - p n (x) q n - l (x 


± 1 


因此 


pu - 

- i 


qv~ c{p n -yu 


q n - Y v) ^ d{ p n u 


q n v ) 0 如果 dO )#0, 我们必定有 deg ( c ) + 


deg (^) 



〜，因为 deg ( g )< deg (〜） ； 由此得出 deg ( c ) 十 d n - X > deg ( d ) + d n , 


因为如果尤 

因此 deg ( pu 


〜这确实是对的，否则我们有 d n . x 



d 



+ 1 > + 心 - 1 


qv ) 


deg ( c ) + d n - lo 但是我们已经假定 deg (卹 


q ^) < d n ^ 2 


d n - \ 



n 


〜_ [; 所以 deg ( c )< e „ - 1 和 deg ( d ) < 0 ，矛盾 


[这个结果实质上属于 L . Kronecker yMonatsberichte Konigl. Preu^. Akad. Wiss. 

( Berlin ：1881),535-600 o 它蕴涵了下列的定理：“设〃 （^) 和是在一个域上的 

互素多项式并设 d^degi z ;) < deg ( u ) 0 如果 g (: c ) 是最小次的 一 个多项式，使得存 

在多项式 /?(: c ) 和 r ( jc ) 且 p ( x ) u { x ) — q { x ) v { x ) = r (: c ) 且 deg ( r ) = d ，则对某 

个 72， p ( jc )/(^( x ) = p „( x )/ g „(: i :)。” 因为如果 A — 2 〉 A - i ， 则有解 <7(工）使得 
deg (d = 〜_ 1 + d — 。，而且我们已经证明这样低次数的所有解都有所述的 


性质。] 

27. 答案 4.3.1-40 的思想适用，但以比较简单的方式，因为多项式算术是无进 
位的； 自右至左的除法使用 4. 7-(3)。或者，对于大的”值，倒过来使用习题 4.6.4- 

57，我们可以除系数的傅里叶变换。 



4.6.2 小节 


4.6.2 小节 

1. 对于 k ^ n 个不同根的任何一个选择，有个至少有这些根一次的首一 
多项式。因此，由 （1.3.3 小节的）容斥原理，没有线性因子的多项式的个数是 

4( -1)、而且它交替小于等于和大于等于这个级数的部分和。所述 

的限对应于々<2和当 n ^- p 时至少一个线性因子的概率是1 - (1 _ l //>) ^ o 
线性因子的平均个数是 f 乘: r 整除以: r ) 的次数，所以它是1 + /+ ■■♦ + P [ ~ n = 


P 


P~l 


( 1 _ ” 。 

[以类似的方式，我们求得，有次数为2的 




卜不可约因子的概率是 




k 《 nj 2 


p(p - 1)12] 



\Yp 


k -2k 



; 当 n >2 时这个概率介于苦- 



4 


P 


一 1 


和 t 


2 


P 


- L 


之间，而当⑺时它趋向于 l _ e_ i/2 (l + | f 1 ) + 0( p _ 2 )。 这样的因子的平均 


个数是 y _+ p _ 2LW2 」。] 

注：设 w (_ x ) 是带有整系数的 一 个固定的多项式 。 Peter Weinberger 已经发现， 
如果 z /(: c ) 是在整数上不可约的，则当声―⑺时， W U ) 的模 /) 线性因子的平均个数 
趋于1，因为 uU ) 的 Galois 群是传递的而且在任何传递排列群中任何随机选定元 
素的 1- 循环的平均个数是1。因此 ， W (: c ) 的模 p 线性因子的平均个数是当 p 时 
在整数上 u ( z ) 不可约因子的个数。 [参见习题37的答案中的说明，以及 Proc . 
Symp. Pure. Math. 24 ( Amer . Math . Soc . ， 1972) ， 321 〜 332 0 ] 

2. ( a ) 我们知道〃（: c ) 有一个不可约多项式乘积的 表示； 而且这些多项式的前导 
系数必须是1，因为它们整除的前导系数。因此我们可以假定 W ( z ) 有首一不 
可约多项式…九（: c ) 〜的乘积的表示，其中 h (: r ) ，…， / v ( x ) 是不同的。除 

了因子的次序外，这个表示是惟一的。所以关于(: T )， W (: T ) 的条件被满足 
当且仅当 

。（工）=〜⑴， w (： c ) = 仏 （工） ^—2 …乂 （工） , r mod 2 

( b ) 次数为71的首一多项式的个数的生成函数是 1 + PZ+ P 2 Z 2 + … =1/(1 _ 
pz)o 次数为 n 有形式 W ： r ) 2 ( z ; (: r ) 为首一的）的多项式.个数的生成函数是1 +如 2 
+ /) 2 /+… = l /( l - pz 2 )。 如果次数为 n 的首一无平方多项式个数的生成函数是 

2 ： ) ， 则由 （ a) ， 我们必有 1/(1 - pz) = g ( z) I (1 - pz 2 、 。 因此 g(z) = (l - pz 2 )l ( 1 

- #) = 1 + 於 + (f 2 - p) 2 2 + ( p 3 - p 2 ) z 3 + …。对于 n^2 的答案是〆 - P n ~ l o 
[奇怪，这证明^1)丄1/(工）的概率是1-1/以由习题4.6.1-5，当 u(:r) 和 v ( x)^L 
关时，它和 W(：C) 丄I；(: T) 的概率相同。] 

注 ：由一 个类似的论证，每个 i / U ) 有惟一的表示 t ; (:(: r )' 其中 Wx ) 是不 
能由任何不可约多项式的第 r 次幂整 除的； 对于，这样的首一多项式(: T ) 的 
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个数是〃 +1 。 

3•命 u(x) = U { {x) u r (x) o 由定理 4.3.2 C 的论证，至多有一个这样的 

u ( x )。 如果对于每个我们能够以叫（: c ) = 1, i ^(： c ) =0，）关々解系统，则至少有 

一个 v ( x ) 0 后者的一个解是其中 aU ) 和 r 2 (: c ) 通过欧几里 
得算法的推广（习题4 .6. 1-3)，可以发现满足 

〜 (：)n 技尸〆工） + v 2 (x)uj(x) = 1, deg ( v x ) < deg (^) 

当 deg(v )<2 时在整数上我们不能使 t ； U ) 三 Hmodulo j ：) 和 x )=0 (modulo 

x ~2) o 

4. 由惟一因子分解，我们有 （i - pz )— 1 = n^id - 在取对数之后，这 

可以重写成 


ln ( l/(l - pz)) = ： ^^k P z kj lj = hp'GpdVj 


Di 


2 




m ) m 


\vm p ^ooa n J p 71 = lln 。 


所述的恒等式现在产生答案 G p (z) 

得到 a r^ = n ju(n/d) p d l n ; 于是 

为证明所述的恒等式，注意 

[数〜首先是由高斯发现的，参见他的 W er Ae 2,219 〜222 


h ( l /( l -/^))， 由此我们 



>1 


g(z m )?n 



n \ m 


//( w ) 


g(z) 


5 •设 a 咖 是在模 p 之下恰有 



个不可约因子的 n 次首一多项式的个数，则 


%(z ， w ) 二 ^j n r>Q a npr z n xv r = exp[^ k>l G p (z k )zv k Ik 


exp 



m>l a mw \n(l/ (1 - pz~ m )) 


参见等式1.2.9-(38)。我们有 


2 






n 


d0 p (zlp ， w)/d 


U ) 


xu 



k>\^p 


G 乂 z k l p k 、、 g p (zl p ， V) 




>1 


因此对于 n >2 ，A 


ln(l/(l - p X ~ n z n )) cp(n)l n^j(l - z) 


71 p 


H 

-2 


n 



ll2p + 0(p — 2 )。 2” 的平均值是 


，2) 


n 



l ^( n ~ l ) lp ^ O ( np - 2 ) 0 (方差是 n 3 阶的，但可置 w 


4。） 


6 •对于户，由费马定理 ，: c _ s 是: - ： r ( modulo 夕）的 




个因子，所以 


X 


P - 


是 1 cm (: c ~ 0 y x 


■ 蜃 


(P 




x 


的倍数。 


因此除了当 k 




1或 



p 时外，斯特林数 


P 

-k ■ 


是夕的倍数。等式1.2.6-(45)表明对于另一类斯特林数 


P 

k 


同样的命题成立。] 



• 右边的因子互素，而且每一个是 w (： r ) 的因子，所以它们的乘积整除 w 


X 


o 


662 



另一方面，〃 U ) 整除 


vu、 p l n 0 “⑺ - 5 ) 

所以由习题 4.5.2-2 它整除右边的式子。 

8. 向量 （18) 是仅有的输出，其第 々个 分量非零。 

9 . 例如，由 jc — 1 和： y — 1 开始；然后重复地置 只[ 0 ：] — y x ^2 x mod 101 , 3 ^ 
5I3 / mod 101，共 100 次。 

10. 下列矩阵 Q-J 有由两个向量 i / 1] = (1，0,0,0,0,0,0,0)， t / 21 」= (0，1，1，0, 

0,1,1 ,1) 生成的零空间。因子分解是 （: r 6 + Jr 5 + I 4 + X + l )(: r 2 + + 1)。 

/> = 2 P 二5 

0 0 0 0 0 0 0 0 ] [0 0 0 0 0 0 0 ^ 

0 1 1 0 0 0 0 0 0 4 0 0 0 1 0 

0 0 1 0 1 0 0 0 0 2 2 0 4 3 4 

0 0 0 1 0 0 1 0 0 1 4 4 4 2 1 

1 0 0 1 0 0 1 0 2 2 2 3 4 3 2 

1 0 1 1 1 0 0 0 0 0 4 0 1 3 2 

0 0 10 110 1 U 02142 1, 

.110 1110 1. 

11. 删去平凡因子： r ， 上边的 Q - I 有一个由（1，0,0,0,0,0,0)和（0,3，1，4，1， 

2，1 ) 生成的零空间。因子分解是 x ( x 2 + 3 x + 4)(工 5 + 2 x 4 + x 3 + Ax 1 + x 十 3) 。 

12 . 如果户=2 ，则（工+ 1) 4 = / + 1。如果 p = 8々 + 1，贝 ！ J Q - /是零矩阵，所以 

有四个因子。对于 p 的其它值我们有 

p ^ 8^ + 3 jt > = 8々 + 5 p = 8 k -h 7 

0 0 0 01 (0 00 01 ro o o o' 

q — j — 0 — 1 0 1 0-20 0 0-1 0-1 

0 0-2 00 00 00 0 - 2 0 

、0 1 0 - lJ io 0 0 - 2H0 - 1 0 - L 

这里 Q - J 有阶 2, 所以有 4-2 = 2 个因子。[但是容易证明: r 4 + l 在整数上是不可 
约的，因为它没有线性因子，而且由习题20,在任何次数为2的因 子中工 的系数的 
绝对值必定小于等于2。（也见习题32,因为 / + 1 =氺 8 (:^。）对于所有 k >2. 

H . P . F . Swinnerton - Dyer 已经指出了一些次数为/的多项式，它们在整数上是不可 
约的，但是在模每个素数之下完全分解成线性和二次因子。对于次数8,他的例子 

是： r 8 — 16 x 6 + 88? + 192 x 2 + 144,有根 ±教 土乃土 i [见施 th . Comp . 24 (1970)， 
733〜734]。按照习题37中所引的 Frobenius 的定理，任何其 Galois 群不含周期 
的 n 次不可约多项式含有模几乎所有素数的因子。] 

13. 情况夕 = 8 々 + 1:(: + (1 + V - 1 )/V2 ) (x + (1 _ V ~ 1 )i42) (x - (1 + 

\! _ 1 )/V2) (x - (1 - V - I )/V2) 0 情况 p — Sk + 3 ： (^： 2 + \/ ~2 x - i )( jo 2 - \! ~2 x - 

■ 

1)。情况 p=Sk + 5：( x 2 + / M ) o 情况 p = + 
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1 ) U 2 - 乃: r + 1)。在实数域上对于户=从+7的因子分解也成立。 

14. 可以把算法 N 修改成求 w 的系数：设 A 是 （r + 1) X ”的矩阵，对于0<々 
< r ， 它的第6行包含 tU ” mod uU ) 的系数。应用算法 N 的方法直到在步骤 N 3 
中找出第一个相关性为止；然后算法以 w (: r ) = W + +…+叫一结束，其中％ 
在 （18) 中定义。这时 2< A < r ，不必预先知道 r ， 因为在生成 A 的每行之后我们可 


以检验相关性。 

15. 我们可以假定 w 关0和 p 为奇数。应用于多项式: r 2 _ W 的 Berlekamp 方法 
告诉我们，一个平方根存在当且仅当 Q ~ 1=0 当且仅当 mod f = 1;但这 

是我们已经知道了的。 (20) 中 Cantor 和 Zassenhaus 和方法，或者对于 d = 1在 （21) 

中更好的方法告诉我们，当 s 是随机选择的时， gcd (: r 2 - w ，（: r + s) (/>_1)/2 - 1) 将以 
>1/2的概率是一个非平凡的因子。在实际使用中，对 s 的顺序选择看起来就和随 
机选择一样好，所以我们得到下列算法：“计算 gcdU 2 - “，工 ( 〃 1)/2 _ l )， gcdU 2 _ 

u,(x + 1) ( 户— 1)/2 - 1)， gcd (: r 2 - u y (x + 2) (p ~ l)l2 _ 1) ，… ，直到找到 gcd 有 x + t ; 的 


形式的头一种情况为止。然后/^ = ± t ；。” 对于很大的 〆 预期的运行时间是 

0 (log p ) 


更仔细的观察表明，这个算法的头一步成功当且仅当 P mod 


时。因为如 


果 P 


1 ，其中 q 是奇数，我们有 




mod 


X 


2 


U 


U 


和 gcd ( 


U 


因为 


U 


Q 


1 ( modulo p ) 


O 


事实上，我们看到，每当 mod 4 = 3 


时公式= 土 u (p + 1)l4 mod p 直接给出平方根。 

但当 p mod 4 = 1 时，我们将有 x ( ^~ 1)/2 mod ( x 2 ~ u ) = u (p 1)/4 ,而且 gcd 将是 

1。因此仅当 f mod 4 = 1时，才应当使用上面的算法，而且随后应省略头一个 gcdo 

当 p mod 8 = 5时一个工作得很漂亮的直接方法是在20世纪90年代由 

A . O . L . Atkiri 发现的。在该情况下它是基于2 ( 广 1)/2 三 -1 这一事实得出 的：置 r — 

(2 u ) ip ~ 5)l8 mod p 和 —(2 m 2 ) mod 户；然后 A = ± ( uv(i _ 1)) mod 户，而且我们 

还有 \J — \ = ± i。[Computational Perspectives on Number Theory ( Cambridge , 
Mass . .-International Press , 1998)，1 〜 11; 也见 H . C . Pocklington , Proc. Camb. Phil . 

Soc.19 (1917),57 〜 59。] 

当夕 mod 8 = 1 时 ，一 个反复试验的方法似乎是必要的。由 Daniel Shanks 随之 
给出的过程在这样一些情况下通常比所有其它已知的方法都要好：假设 P 二 
1，其中 ^>3 0 

S1. 在的范围中随机选择工，并置 z = 工 9 mod 户。如果 2 2 mod p = 

1，则重复这一步骤。（重复的平均次数将小于2。在步骤 S 2 和 S 3 中将不 

需要随机数。实践中通过试验小的奇素数工我们可以节省时间，而且当 

1)/2 m 0C i : c = ： r-l 时，以 z - x q mod p 停止；参见习题 1 .2.4-47 0 ) 

S 2 •置 y^z , r — e,x — u {q _ im mod p , v — uoc mod p , uj ^ ux 2 mod po 

S 3. 如果 W = l ， 则停止 P 是答案。否则求使得 ^ 2 "mod p 等于1的最小的 々 o 
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如果 々 = r ， 则停止（无答 案）； 否则置 — ， k ， v /_ — ， 

W r 1)，并重复步骤 S 3。 ■ 

这个算法的正确性来自于不变同余式 uiv = v 2 , y 2 = - 1, VL ?- 1 三 1( 模> )。 

当 w 关1时，步骤 S 3 执行 r + 2 次模 f 乘法； 因此在该步中极大的乘法次数小 
于 P ，而且平均次数小于因此对于步骤 S1 和 S2 的运行时间是 0 

1 / 乙 \ A I 

(log P ) 3 , 加上对于步骤 S 3 的阶为 ^ 2 (log f ) 2 , 这同基于 （21) 的随机化方法的仅为 
0 (log />) 3 相当。但是 Shanks 方法中的常数因子是小的 。 [Congressus Numeran - 

tium 7( 1972) ， 58 〜 62 。 一 个有关的但不大有效的方法由 A • TonelU 发表在 Goffinger 
Nachrichten (1891)，344 〜 346。头一个发现具有预期运行时间 0 (log f ) 3 的平方根 
算法的人是 M.Cipolla , Rendiconti Accad . Sci . Fis . Mat . Napoli 9 (1903) ， 154 〜 163。 ] 

16. a ) 在对于 n = l 进行的证明中，以多项式模 p 代替整数。 b ) 把对于 n = l 
的证明贯彻到任何有限域中 D c ) 由于对于某个 = #，因此由/( I )定义的域中 

: ^ n = x 。 而且，在这个域中满足等式 y ’ = y 的元素^在加法之下封闭，而且在乘法 

之下也封闭。所以，如果 x ’=: c ，则 f (作为有整系数的1 的多项式）满足 = 

17. 如果 f 是一个原根，则每 一 非零元素是 f 的某个乘方。因此阶必定是13 2 
- 1 = 2 3 • 3 • 7的一个因子，且 〆 /) 个元素有阶/。 

/ 〆 /) / ^(/) / < p ( f ) f < p ( f ) 

1 1 3 2 7 6 21 12 

2 1 6 2 14 6 42 12 

4 2 12 4 28 12 84 24 

8 4 24 8 56 24 168 48 

18. ( a ) 由高斯引理， pp ( h ( 〜工 )) … pp ( p r ( u n x )) o 例如，设 

u ( x ) = 6 jc 3 - 3 x 2 + 2 x — 1 
v ( x ) - x 3 - 3 x 2 + I 2 x - 36 = ( x 2 + 12)( j ： 3) 

则 pp (36 x 2 + 12) = 3^ 2 + 1 , pp (6^ - 3) = 2^ - 1 0 (这是 14 世纪时使用过多年的求 
解代数方程技巧的一种现代形式。） ‘ 

( b ) 设 pp ( w ( u n x )) = w m x m 十…十切 o = 其中 c 是： r 的多项式 

u ;( 的容度。 J 3 IJ vu ( x ) = ( cwl O 工肌+…十挪 0 ，因此 cw m = C ;因为切饥是 

U „ 的一个因子，因此 C 是 W — 1 的倍数。 

19 • 如果 u ( x ) = t ; (: c ) w ( x ) 且 deg ( v ) deg ( w ， 则 u n x n = v ( x ) w ( x ) 

(modulo f )， 通过模 > 的惟一因子分解可知，除了 r 和 w 的前导系数外所有系数都 
是 > 的倍数，且沪整除 幻0 w 0 = u 0o 

20. a) _ 〜 ― 。（而 )_ 。厂 」== 2( w 厂叫 — 。（七 _㊈ 厂山 b ) 我们可以 
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假疋 “ o #0。 设 m { u ) ~ Tlj ! = i min (1, | ^ ; | ) = | Uq \ IM ( u ) 0 每当 | 七 | 〈1 时，把 

w ( x ) 中的因子 x _ 七变成力 x -1; 这并不影响 II w tl ，但它把 li / ol 改变成 M ( w )。 
c )〜 = .，即一个初等对称函数，因此 I 屮 |< U 」2 ft … A ，其中 A 

1 ni j 1 Tfl — j 

=max ( l ，| a 」）。 只要证明当 o ： i > l ， …，: c „> l 和： T ! …时，初等对称函数 

M + | 77 ^ 1 j ，即当 a 二…= : r „ — ；! = 1 和 x n = M 时所取 
的值，整个证明即完成了。（因为如果…，变换 x n ^~ x n ~\ X n y x n - i^l 



使 Q 增加正量 0( n - 


2)(k - [) \ x 


1) (x n -i - l)o) d) 


V 





m — \ 
;-1 


v 


m 


/ / m _ 1 \ 、 / 

< . M(u 



?n — 1 
i-l 


w， 7 I ，因为 M ( t ； X M ( w ) 和 I z ； 


m 




W ，， o 


.见 M - Mignotte , Math . Comp - 28 (1974) ,1153 


0^^ , 


1157 


^) I I 是上限，所以我们希望有对 

MU ) 的一个更好的估计。已经知道有若干个方法 [ W . Specht ， M a th . Ze ; Y . 53 
(1950) ，357 〜 363; Cerlicnco , Mignotte 和 Piras , Symbolic Comp . 4 (1987)，21 〜 
33]。 最简单也最快捷的也许是下列过程[参见 C . H , Graeffe .AuflOsung der hoheren 
numerischen Gleichungen ( Zurich ； 1837) ] : u ( x ) = u u (x - a x )- m (x ~ a n ) xl 


注 ：这个 解表明 


m — 1 


M(u 


m 



( x ) — u (\foc ) m u ( - \Tx ) = (— l ) /7 w ^(: r - Q ^)".(: r - Q ^)。 于是 M ( u ) 2 = M(iiX 

U II 。因此我们可以置 c — || w || ， v — u jc ， t ^-0 , 然后重复地置 t — t + l j c ^~ \\ v 
II m ， c . v ^- v ! || t )|| o 不变关系 MUhcMO ) 1 〆 和 IU II =1 确保在迭代的每一步 

都有 M ( uXc 。 注意当 v(^) = vq(x 2 ) + : rw ! ( x 2 ) ， 我们有 v ( x ) = ^ 0 ( x ) 2 - XV [ 

(-3： ) 2 o 可以证明，如果每个 I ~ I 小于等于或大于等于1/^，则 M ( u ) = || w || ( 1 + 

0(/9)); 因此在〖步之后，(：将是 M ( w)(l + 0((0 2 ))。 

例如，如果 以、 Z ) 是 （22) 的多项式，对于 r =0，1，2,…， C 的逐次值是10.63, 
12.42,6.85,6.64,6.65,6.6228,6.62246,6.2246,…。在这个例子中，七.90982。 

注意收敛并非是单调的。最终 Wz ) 将收敛到单项式 x ' 其中 m 是使|~|<1的根 

的个数，假定对于所有的7,1~|关1; 一 般说来，如果有满足|~| =1 的々 个根，则 

， 和的系数将不趋于零，而 I 的较高和较低次幂的系数将趋于零。 

由 JensenlActa Math . 22 (1899) ，359 〜 364] 给出的一个著名公式证明 MU ) 是 

单位圆上 1+)1 的几何平均 ， gp e xpgj ^ ln |/( e l ” Id " 。类似地，习题 21 a ) 将 

说明 II w || 是单位圆上 |^(: r )| 的均方根。不等式 M ( u ) \\ u || 可追溯到 
E . Landau [ Bu //. Soc . Math . de France 33 (1905) ,251 〜 261 ] ，它可理解为均值之间的 

一 个关系。数 MU ) 通常称为一个多项式的 Mahler 测度，因为 Kurt Mahler 在 
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Mathematika 7 ( 1960 ) , 98 — 100 使用 了它。碰巧 ， Jensen 也证明了，当 m 〉0 时， 



2 


a 


m 


1(2 m max ( ! a 



O 


21 . a ) 除非 p + s=q + t •，否则两边％\~太的系数为0。而且当这个条件成立 
时右边的系数是 （p + s ) h 左边是 




(q + r) ! 


[ B . Beavzamy 和 J • Degot , Trans . Amer . Math . Soc . 345( 1995), 2607 〜 2619; D . Zeii - 
berger,AMM 101( 1994),894 〜 896 。 ] 

b ) 令 < 2 p = v ? y b q = zv q , c T = v ry d s = 拓 s ; 于是 a ) 的右边是 B ( u ) ，而左边是对于 

每一个 j 和 k 的非负项之和。如果我们只考虑其中 Sj 是 W 的次数的那些项，则除 
非当 P = j 时否则项 u p /( P - j )! 将消失。因此那些项归结为 


S ： 


ik 


j ! k ! 


v ； w k } ! k ! l 2 = B ( v ) B ( w ) 


[ B . Beauzamy , E . Bombieri , P . Enflo R H . Montgomery J . Number Theory 36 (1990)， 

219 〜 245o] 


c ) 如果需要使每个项都成为齐次的，增加一个新变量不改变关系 M 
此，如果 r 和 te ; 分别有总次数 m 和 n ，我们有 （m + rz ) ! [ u ] 2 ^? n \ [v _ 


vvu 


O 


因 


n 


zv 


换言之， [^][ 


m 



n 


1/2 


U 


o 


m 


顺便指出，考虑 Bombien 范式的一个好方法是想像诸变量是非交换的。例如， 


代替 3 V - z 2 w 2 我们可以写 



+ 





4 了，丁 了 3^30^ 4 


yy^y 




4 


3 W 工 



ZZWW 



ZWZW — 



ZWXVZ — 



6 


WZZU) — 



6 


U)ZWZ ~ 



VOXVZZ O 


于是 Bombieri 范式是在新的 


系数上的 I I 范式。当 w 是次数为〃的齐次式时，另一个有趣的公式是 


u 




w (x 十 iy) 1 2 dxdy 


d ) 一 个变量的情况对应于 n 假设 W = 其中^是（个变量中次数为 m 
的齐次式。于是对于所有的 k ， U k | 2 k ! / m ! <[ r ] 2 , 而且 k ! 因为对 

于了>0，1呢以工）是凸的；因此|%| 2 <桃！ Vv ] 2 l ( mlt ) V 0 我们可以假定 m ! [。] 2 / 

(?n 11) V < m ' \ [ wpRm '/ O !’， 其中 rn ' = n - m 是 tx ; 的次数。贝 lJ 

I 1 2 ^ m \ \_ v ^ 2 j ( m j t ) \ l ^ 


m . \ ^ 2 m ' \ l ^ 2 [v \ [ vu ]/( ml t ) ! " 2 ( m 70 ! " 2 < 
n \ ] l 2 [ u ] l ( nl 2 t)\ l 

(如果我们把所有次数为 m 的表达式中未排除一个因子的倒数第二个表达式极大 
化，就得到一个更好的上限。）量 n \ ll 4 l ( nl 2 t )\ tl 2 是 c t (2 t y 14 
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rB.Beauzamv J - Symbolic Comp . 13 (1992)，465 〜472,命题5。_ 


g ) 由习题20, 


n 


- 1 


lnl2] 


M ( 


u 




n 


- 1 


Vn\2\ 


u 



2 < 


[w] 2 = 上面的不等式也从 f) 得出，因 

; V ； / J J \ji 

为如果 = 〜 n/ 、 u- 〜 ) 我们有 [“] 2 <i- 勺 ] 2 = \ u n \ 2 n^ } (i 

+ 1^1 2 )^1^„1 2 ]^1(2 max(l ， |a ; |) 2 ) = 2 ”MU ) 2 。 

22. 更一般地说，设 u(x) = v(x)w(x)( modulo q) ,a(x) v(x) + b(x)zv(x) 
=1( modulo p 、 及 c * £ (v) = l ( modulo r ), deg (a) < deg (zv), deg (b) < deg (v )， 

deg (u) = deg (t;) + deg (tx>) ， 其中 r = gcd( p , q) y p , q 不必是素数。我们将构造多 

项式 V( ： c) 三 i;(:r ) 和 W(x) = uu(x )(modulo g ) 使得 u(x)=V(x)W(x) (modulo 

qr) ,£(V) ~ £(v) ， deg( V) = deg( v ), deg( W) ~ deg (w ); 而且如果 r 是素数，则结 

果在模 gr 下将是惟 一 的。 

这个问题要求我们在 V (x) = v (x) qv (jc) y W (x) ^ w (x) ^ qW ( sc ) ， 
degU)<deg(rO ， deg ( 切 ） <deg(>) 的情况下求 5( 上）和而另一个条件 

(v(x) + qv^x)){vo{x) + qzv (x)) = u{x) (modulo qr ) 

等价于 w{x) v ( x) + v(x)w(x) = f(x) ( modulo r )， 其中 /(x ) 满足 u (x) = 
v(x) uj(x) + qf(oc) ( modulo qr) 0 对所有 K ： c ) 我们有 

(a(x)f(x) + t(x)w(x))v(x) + (b(x)f(x) - t (x) v(x))-w(x)= 

f{x) (modulo r) 

由于在模 r 之下 /(rO 有一个逆，我们可以通过算法 4.1.6D 求一个商 Z(x )， 使得 
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deg( bf - tv )< Aeg { v ) ;对于这个 t { x ) ，deg(a/+ tuo )^ deg ( w ) , 因为我们有 deg(/) 
^deg( u ) = deg( z；) + deg( vu ) 0 于是所求的解是 v ( x ) — b ( x ) /( 工 ） - t { x ) v ( x ) — 
b ( x ) f ( x ) mod v ( x ) y u )( x ) = a ( x ) f ( x ) + t ( x ) uu { x ) 0 如果 （5(:c), 〶 （工））是 
另 一^ 个解，我们有 （5(:c) - w ( x )) v { x ) = { v { x ) — v ( x )) , w { x )( modulo r ) 。于是 
如果 r 是 素数， r ( 工 ） 必定整除 v { x ) ~ v ( x ) ; {§ deg( v ~ v )< deg( i;) ，所以 v { x ) ~ 
6(:c) 而且 w ( x ) — i^(:r)。 

如果 p 整除 g， 使得 r = >， 则如同 Hensel 引理所要求的那样，我们对 VU) 和 

W(x) 的选择也满足 a(x) V { x ) ^ b{x)W ( x) = l ( modulo p) 0 

对于 f = 2,因子分解过程如下（只写系数，对负的数字表 示）： 

习题10指出，在一位2的补码记法下，〜 （x) = ( in ) f w 1 ( x ) = (HTooTI)。 欧几 

里得扩充算法产生 a (x) = (100001)，6(：T) = (10)。 由习题20知因子 z；(x) = ^ 2 + 

C!X+c 0 必定有 I q | <L1 + /IB」 =11， I C。I <10。三次应用 Hensel 引理产生 
i; 4 (:c) = (131)，xe；4(:c) = (1354435)。 于是 c y =3 和 c 0 e - 1 (modulo 16); w (x ) 

惟一可能的二次因子是 x 2 + 3: c -1。 除法做不了，所以以幻不可约。（因为我们现 
在已经用四个独立方法证明这个可爱的多项式的不可约性，它不可能有任何因子。） 

Hans Zassenhaus 已经发现：通过加大/?和，我们通常可以加速这样的计算：在 
上述记法下当 r = p 时，我们可以求焱（：0，別^)，使得义（：0\^(；0十5(2)\^(：0 
=1( modulo p 2 )， 即通过取 A(*x) = a(x) + pa(x) y B(x) = b{x) + /^(:r)， 其中 

a(x)V(x)^rb(x)W(x) = g{x) (modulo p) , a{x) V ( ^: ) + b {x) W {x) = \ ~ 

fg(x) (modulo/? 2 ) 0 我们也可以求满足 /( V) C 三 1(modulo/> 2 ) 的 C 0 这样一来我 
们可以把一个无平方因子分解 u ( x ) = v ( x ) w ( x ){ modulo /? ) 升格为惟一的模户 2 ， 
户 4 ，/) 8 ，〆 6 扩充等等。然而，只要我们达到双精度模，这“加速”的过程就会在实践中 
达到一个转折点而趋于下降，因为在实用范围内做多精度数乘法所需要的时间抵消 
了直接对模取平方的优点。从计算的观点看，用逐次的模 p，^,〆，/) 8 ，一，/)' 
/ + %^ £ + '/ + '〜进行工作似乎是最好的，其中£：是使〆 大于单精度的2的 
最小幂次，而 e 是使，有单精度的最大整数。 

“Hensel 引理”实际上是由 C. F. Gauss 于大约1799年在一部未完成的书稿中发 
明的， Anaiysis _Resic/uorum ，§ 373〜374。高斯把这本手稿的大部分内容加进他的 
Disquisitiones Arithmeticas (1801) 中，但直到他去世之前他关于多项式分解的思想一 
直未发表过[参见他的 Werice 2 (Gottingen, 1876) ,238 ] 0 Hensel 的名字被附加到这 
个方法上，这是因为它对于纩8出(：数理论是基本的（参见习题4.1-31)。这个引理可 
以以好几种方式进行推广。首先，如果有多个因子，比如说 

Vi,(x ) (modulo />)，我们可以找到 工）使得 a { ( x ) v 2 ( x ) v ^( x ) + 

a 2 (x) v { (x) v 3 (x) + a^(x) vy(x) v 2 (jo ) = 1 (modulo p)S. deg( a,) < deg( % ) 。 （实 

际上， 1/ W (: r) 被展开成部分分式如: Sa z (:c)/%U)。） 一个完全类似的构造现在允许 
我们把因子分解升格而不改变 h 和 W 的前导 系数； 我们取 v x {x) = a x (x)f(x) 
mod v { (x) , v 2 (x) = a 2 (x) f{x) mod v 2 (x) 等等 。另一个重要的推广是当实现多 
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变量的 gcd 和因子分解时取分别形如 p e ， U 2 - a 2 )〜， …〆 A - 的好多个联立 
的模。参考 D . Y . Y . Yun , Ph . D . Thesis ( M . I . T . ,1974)。 

23. pp( w (: r)) 的判别式是一个非零整数(参考习题4.6.1-12)，当且仅当 p 整除 
此判别式时，它有多个模 f 因子。 [(22) 的模3因子分解是 （x + l )(: r 2 - j ：- l ) 2 U 3 
十工 2 -： ? ： + 1) ; 这个多项式的平方因子仅对/> = 3,23,233和121702457出现。不难 

证明，如果 7?. = degU ) 和 N 是 w ( x ) 系数的上限，则最小的非不幸运素数至多是 

0 (n log Nn ) o ] 

24. 以一个适当的非 0 整数来乘有有理系数的首一多项式，以得到整数上的一 
个本原多项式。在整数上分解这个多项式，而后把这些因子转换成首一的。（这样 

因子分解不会有任何 损失； 见习题 4.6. 1-8。） 

25. 考察常数项可知，没有次数为1的因子，所以如果这个多项式是可约的，则 
它必定有一次数为2的因子和一次数为3的因子。这些因子在模2下是 x(x + l ) 2 

(: r 2 +工十 1) ;这没有多大用处。在模3下这些因子是 （ J 十 2) 2 (> r 3 + 2工+ 2)。在模 
5下它们是 O 2 + j : + l )(: r 3 + 4 jt +2)。所以我们看出答案是 U 2 + x l )( x 3 ~ x + 


2)。 

26. 由 D — (0".01)开始，表示集合|0( o 然后对于 ，置 D^~D V ( D ^~ 
—<) ，其中 V 表示逻辑“或”，而 D — d 表示 D 左移 d 个二进位。（实际上我们只需 

使用长度为「（^ + 1)/21 的一个二进位向量，因为《 _ m 在这集合中当且仅当 m 在 

这集合 中。） 

27. 习题4指出，次数 n 的一个随机多项式在模 P 之下不可约的概率比较低， 
大约为 II n 。 但由中国剩余定理可知，整数上〃次随机首一多项式相对于々个不同 
素数均可约的概率大概是而且当 oo 时这趋于0。因此，整数上几乎 
所有本原多项式相对无穷多个素数不可约；而且几乎所有整数上的本原多项式也不 
可约。 [ W . S . Brown 已给出另外一个证明，见 AMM 70 (1963) ，965〜969。 ] 

28. 参考习题4;概率是 [ / ](1 + a lp zl p)(l + a lp z 2 l p 2 )(l + a 3 p z 2 l p 3 ) …，它有 


极限值 g (2：) = ( l +2 ：)^l + 




3 ) …。对于 l < n <10, 答案是1， 音， 


7 37 79 173 101 127 1033 「沿 " x _ 1 n ,、 

12 , 60 , 120 , 280 , 168 , 210 , 1680° L i/C：y)_ n( 


^ = 0( y 2 ) ，我们有 


g(z ) 二 exp z n \n + n>] f(z n I n、) : h(z)Kl - z) 

而且可以证明，当 n —oo 时，极限的概率是 h ( l ) = exp ( S ?2>1 /( l / n )) = 
.56146。 其实， N . G.de Bruijn 已经确定了渐近公式 lim^oo a np = e _Y + e —+ 
0( n ~ 2 log n ) 。[参见 D . H . Lehmer , Acta Arith . 21 (1972 )，379 〜 388; D . H . Greene 
和 D . E . Knuth , Math , for the Analysis o { Algorithms ( Boston : Birkhauser , 1981)， 

§4.1.6。] 另一方面，当 p = 2 时对于 l<n<10 的答案是更小的 ： 1，HH 


7 27 111 109 109 
16 , 64 , 256 , 256 , 256° 


A.Knopfmacher 和 R . Warlimont [ Trans . Amer . Math . Soc . 
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347(1995)，2235〜 2243] 已经证明，对于固定的 p ， 概率是& + 0( l / n )， 其中 %二 

+ c 产.397。] 

29. 设 wU ) 和 g 2 U ) 是 gU ) 的两个不可约因子。由中国剩余定理（习题3)， 
选择次数 <2 d 的一个随机多 项式八 1 ) 等价于选择次数的两个随机多项式 

q (: r ) 和以工），其中 ti ( x ) = t ( x ) mod g , ( :r ) 。如果 t { ( x )^ — l)/2 mod q \( x ) = 1 

和 t 2 ( x) (pf ~ 0/2 mod q v ( x )^\ ，或者反过来， gcd 将是一个真因子，同时对于^ ( j :) 
和 Z 2 U ) 的恰好 2 ((/- 1)/2) (( 〆 + l ) l 2) = ( p 2 d -1)/2 种选择这个条件成立。 

注 ：我们 这里仅仅考虑关于两个不可约因子的特性，但真正的特性要好得多。 

假设每个不可约因子 ％(: r ) 对于每个 Kz ) 有1/2的概率整除 zU ) ( ^ 1)/2 - l ， 而同 
别的 ％ U ) 和 zU ) 的特性 无关; 并且假定 gU ) 总共有 r 个不可约因子。然后如果 

按照对于逐次试验的 r (: r ) 能否整除以1) (/ 4 )/2 -1，我们用一个0和1的序列 
来对每个 &(： r ) 进行编码，则我们得到一个随机的带有 r 个叶的二叉检索结构 
(见 6.3 节）。在这个检索结构中，每个有 m 个叶作为后裔的内部节点的代价是 

0 ( m 2 (log />));而且由习题5.2.2-36，递推式 A , = ( ^ ) + 2 1 ~ S ( ^ ) a , 的解是 A „ 

。因此在这个似真的假设下在给定的随机检索结构——表示完全分解 g 

(: c ) 的预期时间——中花销之和是 0( r 2 (log p ) 3 ) o 如果我们随机地选择次数 
的 〆 x ) 而不是限制它的次数 <21则这个似真的假设就成为严格正确的了。 

30 . 设 了 （ x ) = x + P 十…+ : c’ 1 是 x 的迹，并设 v ( x ) 二 T ( t ( x )) mod 

g ( x )。 由于在多项式剩余模 gU ) 的域中 = 我们在该域便有 vUY 

= v ( x ) ;换句话说是方程 y 5 -：y = 0 的个根之 一 。因此 w (_r ) 是 一 ^个整数。 

由此得出 ， H f = o 1 g c< ^ ( gd (^) y T ( t ( x )) - s ) - gd (^) o 特别是，当 p = 2 时，我 

们可以像在习题 29 中那样论证，当& ( x ) 至少有两个不可约因子和 Hr ) 是次数< 

2 d 的一个随机二进多项式时， gcd (& U )， T ( z(：r ))) 将以大于等于1/2的概率为 

❿ U ) 的一个真因子。 

[注意，从 —《（ JC ) 开始，并重复地置 u ( x )^( t ( x ) + Ii ( x ) p ) mod g ( x ) 

共 d ~ 1 次，可以计算 T ( Z (: c )) mod g ( x )。 本题的方法是以多项式因子分解: 

为基础的，它对任何 p 成立，同时公式 (21) 是以对奇数 p 的 

多项式因子分解 — X — x { x^ P - D /2 + 1 )( 工 - 1 _ 1 ) 为基础的。] 

迹是由 Richard Dedekind 引入的， H^Abhandlungen der KonigL Gesellschaft der 
Wissenchaften zu Gottingen 29 (1882) ， 1 ~ 56。计算 gcd (/(: r ), 了来求 f 
(:c ) 的因子的技术可追溯到 A . Arwih ， Ar / aV /6 r Maf . ， Asfro . och Fys . 14, 7 (1918)， 
1 〜 46; 但他的方法是不完备的，因为他没有考虑八工）尹: r 时的丁 0( x ))。 后来由 
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R . J • McEliece 设计了使用迹的 一 个完全的因子分解算法 , Math . Comp. 23 (1969) , 
861〜867 ;关于渐近的快的结果，也参见 von zur Gathen 和 Shoup , Computational 
Complexity 2 (1992) ,187 〜 224 ， 算法 3.6 。 

Henri Cohen 已经发现，对于 p = 2，当应用这个方法时，只须检验至多 d 种特殊 
情况〆: r) = u 3 , …，: 就足够了。每当心 U) 是可约的时 “（:r) 的这些选择 

之 一 确保分裂仏（: r )， 因为利用三丁 （ Z (: t :)) 和 T (u ( x ) + t ( x )) = 

T ( u ( x )) + T ( t ( x )) (modulo gj(:r )) 这些事实 ，由 这些特殊情况，我们可以得到次 

数〈2d 的所有多项式 Z(x) 的效果。 [A Course in Computational Algebraic Number 
Theory (Springer, 1993) ，算法 3.4.8 。 ] 

31. 如果 a 是〆个元素的域中的元素，设 dU) 是 a 的次数，即使得〆=«的 
最小指数 e， 则考虑多项式 

P a ( x ) = (x - a)(x - a p （ oc - a p ) = q a ( x ) d i d ( a 、 

其中是次数为 Wa) 的一个不可约多项式。当 a 跑遍这个域所有元素时，对 
应的 9a (x) 跑遍其次数 e 能整除 d 的每个不可约多项式，其中每个这样的不可约多 


项式恰出现 e 次。我们有（工+〖） ( /^ 1)/2 


mod ^(^) = 1 当且仅当在这个域中 U + 


Z ) ( ’_ 1)/2 = l 。 如果 f 是一个整数，我们有 d(a + 0 = dU )， 因此 n (户， ㈦ 是厂 1 乘 
以使得^>~ 1)/2 = 1的次数为 d 的元素 a 的个数。类似地，如果，我们要来计 


算使得（《 + 艺 1 ) ( /- 1)/2 =卜 + 0) ( /一 1)/2 ，或等价地（（《 + 艺 1 )/心 +， 2 ))(^- 1)/2 = 1的 

次数为 d 的元素个数。当 a 跑遍次数为 d 的所有元素时，量 （a + G)/U + ~) 二1 + 
( t \ ~ t 2 )/(a + ^2) 也如此。 


[我们有 n ( p } d )--^ d ~ i ' S c \ £ i ( 3 ^ ( ~ l ) c ) ju ( c ) ( p d!c - 1)，它大约是不可约 

多项式总数的一半——事实上，当 d 为奇数时，恰好一半。这就证明当 Z 固定而 

AU ) 随机地选择时，用 gcd ( g ^(^),( x + 0 (/_1)/2 - 1) 求得仏 U ) 的因子的可能 
性 很大; 但是一个随机算法应当如同在习题29中那样，对 固定的 心 （ x ) 和 随机的 Z ， 
以保证的概率进行工作。] 

32. a ) 显然 Y-l = ； nU w K ： r )， 因为对于某个惟一的 d \ 心每个复数 72 次 

单位根是本原 d 次根。第二个恒等式从头一个 得出； 而少“: r ) 有整系数，因为它借 

助于带有整系数的首一多项式的积和商表达。 

b ) 提示中的条件足以证明 /( x ) 二平„ c )， 所以我们应采纳提示。当不整除 

n 时，我们有: c ” _ 1丄~ 1 modulo ^>，因此 jc 71 - 1在模 p 下是无平方的。如同在提 
示中那样给定/(2)和？，设 gU ) 是使得 g ( O 0 的(: C ) 的不可约因子。如果 

g { x )^ f ( x)M / U ) 和 gU ) 两者都是 K ： C ) 的不同因子，因此它们是/ -1 的 

不同因子，因此它们在模户之下没有公共的不可约因子。然而的一个 
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根，所以在整数上 § 以(/(；0 4(:^))关1，因此/(：0是 g ( P ) 的一个因子 。 由（5)， 
/ U ) 是的一个模/>因子，同 / U ) 和 gU ) 没有公共的不可约因子的假定矛 
盾。因此 / U ) = gU )。 [对于素数的不可约性首先是由 C . F . Gauss 在 

Diquisitiones Arithmeticae ( Leipzig , 1801 ) , Atr . 341 中证明的，而对于一▲般的 ti ， 是由 
L . Kronecker 证明的 ，见 J . de Math . Pures et Appliqu 6 es 19 ( 1854) ， 177 〜 192。 ] 

c ) 少 〖（■ Z ):：?： — 1; 而且当 /> 是素数时 ，少 p ( J ：) = 1 + ：C + … 十：?：々- 1 。 如果 72 > 1 

是奇数，不难证明 ％„ U ) = >^(-： r )。 如果 f 整除 n ， 则 a ) 中第二个恒等式表明 

(工 ） = ("^)。如果不整除 n ，我们有卞 >(1) = K Wt ( x )。 对于非素 

数 n <15 ，我们有少 4 ( 工）= I 2 + 1 ，少 6(工 ） — x 2 - x + I , ( x ) = j : 4 + 1,^ 9 ( x )= 工 6 

+ x 3 + 1 ，少 10 ( ： c) — X 4 - + X 2 ^ X 1 ， ^^ 2 ( 工） =: r 4 _ J：2 + l,>Ir i4 (j：) = X 6 - x 5 + 

— + — + — + — + — + [公式 少加 { x ) = (1 

+ p + — + ： c U - i)/ 5)(：c — 1)/( / — 可以用来证明当户和 g 是素数时氺 ~ 的所有 
系数为± 1或0;但(: T ) 的系数可以任意大。] 

33. •假 的； 我们损失所 有岛且 ^可为/>所整除。如果 p > degU ) 则为真。[见 
习题36。 ] 

34 . [ D . Y . Y . Yun . Proc . ACM Symp . Symbolic and Algebraic Comp . (1976)，26 〜 

35。]置（/(工），1 1 (：2：)， 1 1£； 1 (：?：) )— GCD ( u ( x ) y u " ( x )) o 如果 t ( x ) = 1, S e —1; 否 

则对于 i = 1,2, y e - 1 置（心 （ 工 ） , v l + i { x ) ，- w l + l ( x ) )—GCD ( vj ( x ) j zv ,( x ) - v ] 

( i ))， 直到求出 <( 1 )= 0 为止。最后置 u e ( x )^~ v e ( x ) o 

为证明这个算法的正确性，我们注意到，它计算多项式 t ( x ) = u 2 ( x ) u 3 ( x ) 2 - 

W 4 ( OC ) 3 …，％ ( X ) = u i ( x ) u i + i ( x ) u i +2( x )-'' ，而且 


UJlix) = U^ix) U i+{ (x) U i + 2 (^c) ''' + 2 W,- ( X ) W y + 1 ( ) W / + 2 ( ^： ) *** + 

+ ( x ) + i (: r ) w ; + 2( 工) ■•. 十 .*• 

我们有 K ： r ) i Wl U )， 因为 Wi U ) 的一个不可约因子整除的第 Z 项之外的 
所有项，因而它与该项互素，而且显然有义( X )丄％ +1 (: T )。 


[尽管习题 2( b ) 证明大多数多项式是无平方的，但在实践中非无平方的多项式 
实际上经常出现。因此这个方法是十分重要的。关于如何改进其效率的讨论，请参 


见 Paul S. Wang 和 Barry M.Trager,SJCOMP 8 ( 1979 ) ，300 〜 305 。 Bach 和 Shamt ， 
Algori thmic Number Theory 1 (MIT Press ， 1996) ，习题 7.27 的答案，也讨论了模 /) 
的无平方因子分解的问题。] 

35. 我们有 u ) j ( x ) ^ gcd ( Uj ( x ) jVj ( x )) * gcd ( u *+ 【（: r ) ，％ (: r )) ，其中 

u * ( x ) = Uj ( x ) u J + l ( x )-' S Vj ( x ) = Vj ( x ) v J + i ( x )-- 

[Yim 注意到用习题 34 的方法进行无平方的因子分解的运行时间至多大约是计算 
gcd ( w (: r )， i /(: r )) 的运行时间的两倍。而且如果有了发现无平方因子分解的任意 
方法，则本题的方法导致 一 个 gcd 过程。（当 w (: r ) 和 v(x ) 是无平方时，它们的 gcd 

就是 U ；2( 工），其中 IV (^) = U ( x ) V ( x ) = (:2：)1^2(工） 2 ;多项式 Uj ( x ) y Vj ( x ) , 
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和 <(X) 都是无平方的。）因此，把一个本原”次多项式转换成为它的无平 

方表示的问题在渐近运行时间最坏的意义下，在计算上等价于计算两个〃次多项式 
的 gcd 的问题。] 

36. 设 RU) 是用习题34的过程计算“士（: r)” 所得的值。如果 deg(U { ) + 

2 deg ( U2) +…= deg ( ^ ) ，则对所确的 j -> Uj{ x) — Uj{x) o 但是一般说来，我们将有 

/>，而且对于 l^j<p , Uj(x) = Yl k ^o u j + m (^ ) 。为了进一步分解这些因子，可 
以计算 Kx)/( U 2 ( X) U 3 ( X ) 2 … — 2 ) = = z(x p )o 在递归 

地寻求之（ :r ) = ( q (: r ) ， z 2 ( :r )> … ） 的无平方表不之后 ，我 们将有 z k (x) = Ilo<j</, 

(: r )， 所以我们可以通过对于 < P 的公式 gcd ( L 7』 U )， QU )) = 
~ + M ( x )， 来计算个别的 Ui ( x )。 当删去了 q (: r ) 的其它因子时，就将剩下多项式 

U pk (jc) 0 

注•.这一过程是相当简单的，但程序较长。如果人们的目标是有用于模完全 
因子分解的一个短程序，而不是特别有效的程序，则修改不同次的因子分解程序，使 

得它对相同的 d 值分离 gcd( - x ,u (:c)) 好多次，直到 gcd 为1为止，这可能是最 
容易的。在这种情况下，你不必像正文中所提示的那样，由计算 gcd( w(x) ， i/O)) 

开始并删去多重因子，因为多项式： r’-：r 是无平方的。 

37. 精确的概率是是等于7的4的个数。因为由 

习题4，％/〆〜 1/j， 我们得到习题 1.3.3-21 的公式。 

注：本 题指出，如果我们固定素数 P 并让多项式以: T) 是随机的，则在模 P 下将 

有以给定的方式分解的可能性。一个难得多的问题是固定多项式 W(X) 并令〆‘随 
机”；结果是对于几乎所有的〃（工），相同的渐近结果成立。 G. Frobenius 于1880年 

证明，整数多项式 〃（: r) ， 当 p 是随机地选定的很大素数时，在模 f 下分解成为次数 

为 d' ，…， d r 的因子，而且其概率等于具有循环长度丨4，…，心丨的 w “）的 Galois 群 

G 中的排列数除以 G 中排列的总数。[如果以工）有有理系数且在复数域上有不同 
的根&，…，匕，则它的伽罗瓦群是使得多项式14⑴… + 6⑴％ +…十 

uu，h， …，％)有有理系数，而且在有理数上不可约的（惟 一的） 排列群 

G ;参见 G. FrobeniusySitzungsberichte Konigl . preu^ Akad. Wiss . (Berlin： 1896) , 689 

〜 703。线性映射： r ^x p 传统上称做 Frobenins 自同构的就由于这一著名论文所 

致。]而且 B. L. van der Waerden 已经于1934年证明，几乎所有的”次多项式都以全 
部 r ? !个排列的集合作为它们的伽罗瓦群 [Math. Annaien 109 (1934) ， 13 〜 16] 。 因 
此，几乎所有固定的不可约多项式 w(：c) 都将如我们所希望的那样相对于随机选择 
的充分大的素数 f 进行分解。关于 Frobenius 定理用于猜测伽罗瓦群类的推广，也 

见 N. Chebotarev ,Math. Annalen 95 (1926)。 

38. 这些条件意味着，当 |zl=l 时或者1、-2/ _2 + … + 

cr” 十 | 或者 | 〜 — — 3 + …+ w 0 | < 一 2 _ 1< I z r, + 〜―― 2 I。因此由 

RouchS 定理 [/ ■左 co/e Poiyfechmque 21 ， 37 (1858) ， 1 〜 34 ] ， 在圆 | z I = 1 内 以 （之）至 
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少有 n -1 或 n -2 个根。如果 W ( z ) 是可约的，则可以把它写成 p ( z ) u ； U )， 其中 


V 


和 


W 


是首 


整多项式。 r 和 W 的根的乘积是非零的整数，所以每个因子都有绝 


对值>1的一个根。因此惟一的可能性是^和 W 两者都恰有一个这样的根而且 
1^=0。这些根必须是实的，因为复共轭 是根； 因此 wU ) 有一个实根 q 且有 Uol 


- 1 
>lc 


但这不可能，因为如果 


r 




l / q ， 我们就会有0 



U 


2广 


+ 


摹■嘐 


+ u 0 r n | ^1 



〜一2厂 


3厂 




W>i 


[ 0 . Perron ^ Crelle 132( 1907 ) ，288〜307;关 


于推广，参见 A . Brauer ， Amer . J . Mat / i .70 (1948) ，423〜432,73 (1951),717-720 


39. 首先我们证明提 示：令 




a 


(x — a y ) (x 


a „) 有整系数， w (: r ) 连同 


多项式 y -八: r ) 的结式是一个行列式，所以它是有整系数的一个多项式 r ,(^) 


则 


V 




们有 deg (w 

给定一 


: ( ai )) … _ Z ))( 参见习题4 . 6 • 1-12) 。如果 w (:？:)整除 v { t { x )) y 
) = 0,因此 r〆 ^) 和 ^(30 有一个公因子。所以如果 r 是不可约的，则我 
) = deg(r t )^-deg(v) a 

个不可约多项式 w ( x )， 其不可约性的一个短的证明是需要的，由习题 


18,我们可以假定以工）是首 




的，而且， deg ( u ) ^3 


o 


想法是如何来证明一个多项 


式八^)的存在性使得通过习题38的准则， 1(30 




r〆 ^) 是不可约的。于是， 


的所有因子整除多项式 iU (: r ))， 因而这将证明是不可约的。如果 K ： r ) 的系 

数都适当地小，则这个证明将是简明的。 

如果 n >3 和仏…乂#0,而且如果下列的“小性条件”成立，则可以证明多项式 


V 


(y) 




蠡 ■ <1 


A ) 满足习题 38 的准则：即除了当 j = ”或当 ft 


|3^|<1/(4 tz ) 时， | 戽 |<1/(4打）。 

这一事实，这个计算是直截了当的。 


利用 Uo 


+ 


+ 


V 


n 


<(l 



Al ) 


m m m 


(1 



A 且 

Al ) 


令 




5 a r 是实的和 a r + i y 


，0 V + 5 是复的，其中 n 


r -V 2 s 和对于 


a 


r 十 s + j 


a 


} 


i o 


考虑对于 l<;<r + s 被定义为況 （2 r =— 和对于 r + s < j^n 


被定义为況的线性表达式 S 

rmaxJj/S^la, |』1 ， 我们有 |$( 以，〜 

(16；2 B：T — \则必存在不同的向量 （ ao , … 


，一 1 

< bB , 


如果 （X 


和 jB 


n ylSnS ： ( a 0 , 


y - 1 ) 〜 


8/2S t ( ao ， 


，〜因此，如果我们选择 6> 

，〜- i ) 和 （ ，…， a “ i )使得对于 l < j < 

，因为有 Y 个向量但至多有 


(16 n 6 B 广一 1 < 6” 个可能的 （ 72 - 1 ) 值元组。令 Z ( 工 ） = ( a 0 _ ^) + 


饞纛籲 


+ ( a n ^ { 


a 


77 一 1 


X 


r ? _ 1 


和戽 


t ( a ,) 


O 


于是小性条件满足，而且爲关0;否则 〖 U ) 将整除 u ( x ) 


o 


[/. Algorithms 2 (1981) ，385〜392。_ 


40. 给定 


个候选因子 v(x 


X 



^d~\ x 


十 


理小数(模妒），且分子和分母都小于等于 B 


O 


1 十…+以，把每个屮改成一个有 

然后以最小公分母来乘，并看看得到 


的多项式在整数上是否整除 
之下同余于 Wz ) 的倍数的因子。 


O 


如果不，则系数以 B 为界的 W (： T ) 没有在模 P 


e 


David Boyd 注意到 


+ 4 x 6 + 工 4 + 4 x z + 4 




(2 x 4 + 4 j ： 3 + 5： c 2 + 4工十 2) x 


(2 x 4 -4^ 3 + 5 x 2 -4^ + 2), 而且他发现了更高次的例子来证明如果它存在，则 e 必 
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定是大于 2 的。 
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01 

02 

03 

Oi 

05 

06 

07 

08 

09 

10 


11 

12 

13 

n 

15 

16 


17 

18 
19 


20 

21 


22 


. x 


，其中77? 


即小于或等于72的2的最高次幂。 


2. 假设: r 是寄存器 A 中的输人，而且 w 在单元 NN 中； 输岀在寄存器 X 中。 


A1 


5H 


A5 


A2 


2H 


A4 


A3 


4H 


ENTX 


STX 


STA 


LDA 


JAP 


JMP 


SRB 


STA 


LDA 


MUL 


STX 


LDA 


JAE 


SRB 


JAZ 


STA 


LDA 


MUL 


STX 


JMP 


LDA 


MUL 


Y 


Z 


NN 


2F 


DONE 


N 


Z 


Z 


Z 


N 


5B 


4F 


N 


Z 


Y 


Y 


A5 


0 

L + 1 -K 
L + 1 -K 

L 

L 

L 

L 

L + 1 
K 
K 

K ~1 

K -1 

K -1 

K -1 

K -1 


z 


Y 


Al . 初始化 
Y—1 


Z 


x 


N 如 n 

转到 A2 
否则回答是 1 


N 


LN/2J 


A 5 .平方 Z 


Z 


Z x Z mod w 


A 2. N 折半 

如果 N 为偶数，则转 A 5 


如果 

N — 



1 ，则转移 


LN/2J 


A 3. Y 乘以 Z 


Y 


Z x Y mod iv 


转 A 5 


做最后的乘法 


运行时间是 21 L + 16 K 



8 ,其中 L 


A (?2)， 比72的二进表 7 K 中的二进位数少 


K 


八72)是在表示中二进位1的个数。 

对于连续的程序，我们可以假定 n 小到可以填人一个变址寄 存器； 否则连续的 


求幂就不可能了。下列程序把输出保留在寄存器 A 中: 


01 

02 


SI 


LD1 

STA 


NN 

X 


rll 

X - 


n 


x 
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03 


JMP 

2F 

1 


1H 

MUL 

X 

N-l 

05 


SLAX 

5 

N-l 

06 

2H 

DEC1 

1 

N 

07 


J1P 

IB 

N 


rA X X mod w 

—rA 

rll—rll - 1 

如果 rll>0 则再次乘 I 


这个程序的运行时间是 14 A /-7; 当时它比上边的程序运行得 更快； 当72 >8 
时，则慢些。 

3 • 指数序列为： （ a ) 1，2，3，6，7，14，15，30，60，120，121，242，243，486，487，974， 
975[16个乘 法]; ( b ) l ，2,3,4,8，12,24,36,72，108,216,324,325,650,975[14 个乘 
&]；( c ) l , 2,3,6,12,15,30,60,120,240,243,486,972,975 [13 个乘 法]; ( d ) 1,2，3， 
6，12，15,30,60,75，150,300,600,900,975[13个乘法]。[最少可能的乘法数是 12; 
这是通过把因子方法同二进方法合起来得到的，因为975 = 15-(2 6 + l ) o ] 

4.( 7?77?7) 8 = 2 18 -1。 

5 . T1. [初始化]对于置 LINKU [ j ]— 0,并置 A —0， LINKR [0]— 1， 

LINKR [ l ]<-0 o 

T 2. [改变层次](现在树的第々层已经从左到右地连接在一起，在 LINKR 

[0] 处开始。）如果6 = r ，则此算法终止。否则置 72— LINKR [0] 0。 

T3. [准备 72] (现在72 是第々 层上的节点，而且 m 指向 A + 1 层上当前最 

右的节点。）置9 —0 ， S — 72。 

T 4. [已在树中？](现在 s 是在从根到72的通路中的 一 个节点。）如果 LINKU 

[72 + S ] 关0,则转到 T 6( 值77+5已在树中）。 

T 5. [插人 n 之下]如果 <7 = 0,则置 m ’ — n + s 0 然后置 LINKR [ n + 5 ] ^ 

q , LINMJ [ ?! + s ] — n，g — 72 + s 0 

T 6 •[上移]置 s — UNKU [〗]。 如果 s 乒0,则返回 T 4。 

T 7 •[配组]如果 g 关0,则置 LINKR [ m ] —— 

T 8 •[移动 72] 置 72— LINKR [72]。 如果则返回 T 3。 

T 9 •[层的结束]置 L 工服 R [ m ]— 0,々—々+ 1，并返回 T 2。 ■ 

6. 用归纳法证明，如果以>〜>">〜>0，则通向数2% + 2^ +…+2〜的通路 

是1，2,2 2 ，‘"，2%，2% + 2^，‘"，2% + 2' +…+ 2^ ;而且每层上的指数序列是在递减 
的字典序下。 

7. 这个二进因子分解方法要求计算： r 2 w 比计算/多 一步； 幂树方法要求至多 
多 一 步。因此 a ) 15-2^ ； b ) 33 m 2 k ； c ) 23-2*; 々 = 0 ， 1，2，3 ，…。 

8. 幂树总是在 m 之下的一层处包括节点 2 m ， 除非它出现在同一层或更早的 
一 层处； 而且它总是在 2 m 之下的一层处包括节点 2 m +1，除非它出现在同一层或 
更早的 一 层处。[对于所有的 m ， 在幂树中 2 m 是 m 的儿子这一点并不是对的；这 
一 点不对的最小例子是772 =2138, 它出现于 15 层上； 而 4276 出现在 16 层的某处。 
事实上，有的 2 m 和 m 在同一层上；最小的例子是 m = 6029。] 
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习题答案 


9 .从 N — « ， ，及对于为奇数，置 Yg — 1开始； 一 般来说，当 
算法进行时，我们将有假定 / V >0, 置 k — N mod m，N 
- LiV / mJo 则如果 A =0,置 Z — Z m 并 重复； 否则如果，其中 g 是奇数，置 Z 

— Z 2 p ， y g — 而且如果 N >0 则置 Z — 〜并重复。最后，对于 k = m -3, 
W -5,…，1置 A + 2; 答案为 Y〆 (大约 ml 2 的乘法是 
乘以1。） 

10. 使用 2.3.3 小节中讨论的 “ PARENT ” 表示 ：利用 一张表 f [ JhKjglOO , 使 
得 p [ l ] =0,而对于 j >2，/>[_；]是恰在上边的节点个数。（这个树的每个节点至 
多次数为2,这对这个表示的效率没有 影响； 它仅仅使这个树作为图示看起来更好 
些。） 

11.1，2,3,5，10,20，（23或40)，43;1，2,4,8,9，17，（26或34)，43;1，2,4,8,9, 
17,34，（43或68)，77;1，2,4,5,9，18,36，（41 或72)，77。如果后两条通路中的任一 
条在树中，则我们对于 n =43 将没有可能性，因为这树必须包含1，2,3,5或1,2,4, 


8,9。 

12. 这样的无穷树不能存在，因为对某个 n ，/( n ) 参 r ( n )。 

13. 对于情况1，用一条类型1的链，后边跟之以 2 A + e + 2 s + G + 2 A +2 s ; 或者 
用因子方法。对于情况2,用一条类型2的链，后边跟之以 2 A + C + 1 +2 b+c + 2 a + 
2 B 0 对于情况3,用一条类型5的链，后边跟之以 2 a +2 a h ， 或者用因子方法。对于 
情况 4 ，n = 135 j D ，所以我们可以用因子方法。 

14 . U ) 容易验证，步 r - 1和步 r - 2不全都是小的，所以我们假设步 r _ 1是小的 
而步 r _2 不是。如果 c = l ， 则 A =2; 而且因为 4 ^ v ( a r ) 

= v ( a r ^ i ) + v { a r - k ) - 1^ v (< 2 r _ i ) + 1，我们有 v ( a r - ! )>3，使 r - 1 成为一个星步 

(以免〜，(^，…， a r _ 3 ， a , …丨仅包含 一 个小步）。于是对某个 q y a r - { = a r - 2 + - 9 ? 


而且如果我们以 a r ^ 2 ,2 a r - 2 , 2 a r -2 + a r 一 q 二 a r 代替〜， 


a 


1 ，a 


那就得到另 


条反例链，其中步 r 是 小的； 但这不可能。另一方面，如果 c >2, 则4<以< 


^\ a r - x 


+ v ( a 


k 


因此 v ( a r - { ) = 4 , v ( a r - 


k 


2,且 c 二 1 。通过考 


虑定理 B 的证明中的六个类型，很容易推出不可能的情况。 


( b ) 如果 X ( a r - k ) <. m - 1，则我们有 c >3, 所以由 (22) , v ( a r - 


k 



v { a 


i )> 


7; 因此和 v (〜两者都大于等于 3 。 所有小步都必须小于等于 r- 々，而 
且 A(a r — & ) = m — 々 + 1 。 如果 A X 则我们必然有 c = 4, 4, v ( a r - { ) = v(a r _ 4 ) 

= 4; 于是 a rM >2 ;r; +2 W_1 十 2『 2 , 而且必定等于 - 1 + 2 m — 2 十 3 ; 


但现在丨意味着〜-丄二心，— 4 。于是々=3和 — 丨〉^.〗 7 ^ — 1 。由于 

a r 一 :< l m 和〜_ 3 <2 ; " _1 ，步 r - 1必然是 倍步; 但步 r -2 不是倍步的，因为 
4 a ，. _ 3 。而且，由于 v ( 〜_3)>3 ， r - 3是一个星步；而且=〜-3 +〜-5将意味 
着 〜_ 5 = 2 W _ 2 , 因此我们必然有〜_ 2 =〜_ 3 +〜- 4 。像正文中处理的一个类似情 
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况那样，现在看来惟一的可能性是 ^ r - 4 = 2 w - 2 + 2 ; ^ 3 , a r _3 = 2 w ^ + 2 w - 3 + 2^ 
+ 2' ad =2 w 十？”〃 1 +2〃 2 + 2 i + 1 ，而且甚至这点可能性也是不可能的。 


15 . Achim Flammenkamp [ Dip/omarbeit in Mathematics ( Bielefeld University , 

1991 ),Part 1] 已经证曰及满足 AU ) + 3=/ U )< rU ) 的数 77 都有 2 a +2 b + 2 c + 

2 e 的形式，其中 A > B > C > D>E 和 B + C + D ; 而且，通过不匹配下列 


D 



2 

八个模式的任何一个，可以精确地描述它们，这些模式是 


^ 1: 



A 


+ 2 A — 3 + 2 C + 


2 


c - 


+ 2 2C 


+ 2 一 A 


，2 



2 a 


一 1 



+ 2 乃 _|- ^ D \ — A + 2 石 + - A + 3 + + 2 - A 



^3B + 5 — 2A 2 丑 + 


- A + 


2 


D 



2 b 


+ D + r A 


，2 


A 



2 b + 2 b_1 + 2 d + 2 d_, , 2 a + 2 b 




2 b 

2 b 


一 2 



2 °+ 2 


D-2 


( A>B + 1),2 A +2 b + 2 C + 2 2B + ^' a +2 b 


+ C + f — A 


，2 a + 2 b + 2 


c 


+ c + 


a +2 2C 


+ 


16 . 户（72)=义（72)十1>(72) _ 1;所以如果 72 =2 々，则 / S ( n )/ A (??) = l ， 但如果 W = 

2 々 + 1 -1 ， 则 l B (n)IX(n)=2o 

17. 设 21 <〜<^删去不影响并 AU … UL 的任何区间 4( 如果 w + 或 
J \< J 2〈 …且 Jk + i.^Jk - 1，则可拋弃区间 （ A ， ，4 ]) 。现在把重叠的区间 （ h ， ] ，…， 

( %， k ] 结合在—起成为 一 个区间 （ j ' ，’ ] = ( j 1，~ ] ，并且注意 

a r < a r ( 1 + + - + < a/ (l + SY U ’— n 

因为（/， 〆 ]的每点在… U (〜，~] 中至多被覆盖两次。 

18 . 如果当 m — 00 时， （ log /( m ))/”?— 0,则称 /( 7?? ) 为—个“好”的函数。 m 的多 
项式是好的。好函数的乘积是好的。如果 g ( m )— 0且 c 是一个正常数，则 


好的7」也是好的，因为由斯特林近似式这等于说，@0)以(1仏（7/2))—0 

\ mg\m) / 


现在以极大项（通过任何达到）来代替求和的每一项。这些项的总数是 


好的，而且(7::)，（二卞2-曾也是好的，因为 (…心 — 0。最后， 


Km + s )2 ]<(2^) 2 7 H <(扣7^ 2 /纟）、其中（4 6 ^是 好的； 把 z 以它的上限值 （1- 
\ ^ / 

々2) m/A ( 77! ) 代替表明 （ m 2 /^ V <2 W(1 _ " 2) /( m ) ，其中 /(/«) 是好的。因此对于很 
大的 m ， 如果0=2 1 1,0<7 ? <|(，则整个和小于，。 

19. a ) 分别为 MHN , MUN,M tij iV ; 见等式 4.5.2-(6)，4. 5.2-(7)。 

b ) f ( z ) g ( z ) ， lcm ( f ( z ) y g ( z)) y gcd ( f ( z ), g ( z )) 0 (出于和 a ) 同样的原因， 

因为复数上的首一不可约多项式恰是多项式 z - %) 

c ) 交换律 A \HB = B ttlA，AUB = BUA，AnB = BriA 。 结合律 A 出 （B 

出 C ) = (A 出 B ) 出 C , AU ( BUC ) = ( AUi 3) UC , An (5 nC ) = ( AnB)nCo 

分配律 AU ( Bnc ) = ( AUB ) n ( AUc )， An ( BUc ) = ( AnB ) u ( Anc),A 
W ( BUC ) = (A 出 B ) U(A ttJ C),A \ i )( Bf ] C ) = (A 出 C )。 幂等律 A 

UA = A，AHA = A 。 吸收律 AU ( APlB ) = A , Afl ( AUB ) = A ， An(A \H B )= 


• 679 . 


习题答案 


A ， AU(A 出 JB ) = A tiJB 。 恒等律和0律 0 tiJA = A ，0 UA = A ，0 nA =0， 其 
中0是空多重集。计数律 A tbB = ( AU 5) HJ ( AriB ) o 类似于集合的那些更进 
一步的性质由规则 A ^ B 当且仅当 AflB = A (当且仅当 A U 5 = 5) 所定义的偏序 

给出。 

注：多重集合的其它普通的应用是亚纯函数的零点和极点，规范形式下矩阵的 
不变量，有限阿贝尔群的不变量等等；多重集合在组合的计数论证中和在测度论的 
发展中是有用的。 一 个非循环的上下文无关的文法的所有终结串形成一个多重集， 
它是一个集合当且仅当这个文法是非二义性的。作者在由 J . D . Ullman 主编的 TTie - 

oretical Studies in Computer Science (Academic Press , 1992,1 〜 13) 的一篇文章中讨 

论了对上下文无关文法进一步的应用，并介绍了运算 A A B ， 其中在 A 中出现 a 次 
的每个元素和在 B 中出现6次的元素在 A FI B 中出现 M 次。 

尽管多重集合在数学中经常出现，但由于当前没有标准的方式来处理具有重复 
元素的集合，因而通常对它们的处理必然略显笨拙。若干数学家认为，对这个普通 
的概念缺乏适当的术语和符号肯定已经成为数学发展的一个障碍。（当然 ，一 个多 
重集合形式上等价于从一个集合到非负整数的一个映像，但这个形式上的等价性对 
于创造性的数学推理实用价值较小，甚至于根本没有实用价值。）自20世纪60年代 
起，作者就已经同许多人讨论过此事，以图找出一个好的补救办法。对于这个概念 
提出的某些名称 是:表 ，串，袋，堆，样本，配权集合，汇集，套件;但这些词或者同现有 
的术语冲突，有不适当的含义，或者是说来太费口舌而写起来又不方便。最终已经 
很清楚，这样一个重要的概念本身值得有一个名字， N . G.de Bmijri 便提出了 “多重 
集合”这个术语。他的建议20世纪70年代以来获得广泛的釆用，因而现在它成了 

标准术语。 

作者选择了 “ A 的符号以避免同现有的符号冲突，并强调它同集合的并的 

类似性。为此目的而使用 “ A + 是不合适的，因为代数学家已经发现 A + B 是对 
于 U + 川 aGA 和丨的一个好记法。如果 A 是非负整数的一个多重集合，则 
命 G (^)= 是对应于 A 的一个生成函数（具有非负整系数的生成函数显然 

同非负整数的多重集合——对应）。如果 G ( z ) 对应于 A 且 H ( z ) 对应于 B ， 则 
GU ) + H “） 对应于 A tU B ， GU ) H ( z ) 对应于 A + B 。 如果我们构造 Dirichlet 生 

成函数 g ( z ) = 2 n e a !/ n z , h ( z ) = 则乘积对应于多重集合 

乘积 AE 。 \ 

20 ■类型 3:( S 。， …， S r ) = ( M 。。， …， M r0 ) = (|0| ,…， |AL I A _ l ， Al ， |A _ 1， 

A , A I , i A _1， A _ 1， A ， A，A 丨 ，…， lA + C -3 ，A + C _3 ，A + C _2 ，A + C _2 ，A 
+ C - 2| )。类型 5: ( M 00 ，… , M r0 ) = (10 l ，-*-， lAl ，| A _ l ， A|，〜，iA + C - 1, A 

+ CUA + C_1，A + C_1，A + CL …， iA + C + D - 1，A + C + D_1，A + C + 
= Mj 0 ® Mn o 

21 ■例如，设以 = 2 8<? + 5 , 工 = ( 2 (q + i)u - 1)/(2 M _ 1) = 2 叫 + … + 2“ + l，y = 
• 680 - 
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2 〜 + 1) “ + 1 0 则 




(2 2(q 


+ l)u 


1 )/(2“ - 1)。 如果 72 =2 4(9 + 1) " + 巧， 则我们由定 


理 F 有 Z (rz )^4( a + 1 ) w + a + 2,但由定理 H , Z * ( n ) 






o 


22 . 除了用于计算： c 的 w - 1处插入外，对其余的都画上下划线 

23. 定理 G (所有的都加上下划线）。 

24. 使用数 - l )，0< i < r ， 当〜加上下划线时，这些数也加上下划 


线； 而且对于< r ，0< i <~ + 1 - 当 q 加上下划线时，数 

也加上下划线，其中 c Q ， Cl ，…是对于 B 的极小长度的 P 链。 


为证明第二 f 不等式，令 B =2〜 并使用（3)。（第二个不等式对定理 G 有极少改进， 
如果有改进的话。） 

25•我们可以假设 A = 1 。利用规则，其中如果< =1，则= 

“ XR ”， 否则八,=“只”，而且其中“只”指的是取平方根，“又”指的是乘以1。例如，如果 

(. 1101101) 2 ,则规则是 R R XR XR R XR XR 。 （存在适合于计算机 

硬件的二进平方根开方算法，需要同除法相当的执行 时间； 因此有这种硬件的计算 
机利用本题的技术，可以计算更为一般的小数乘方。） 

26•如果我们知道值（心，心_1)，则有 + =(圮+ & — 卜巧）和 （ F 2 々， 

所以利用 0 (log n ) 次算术运算，一个二进方 

法可用来计算 （ F „， 圪 _ i )。 也许更好的是使用值偶 （ R ， M )， 其中 L k = F k .^ F k + l 


(参见习题4.5.4〜15);则我们有（巧 + 1 ，1^ + 1 )二 ( y ( F , + L ,), y (5 F , + L ,) J , 

( F 2 k y L 2 k ) = ( F k L k ,L 2 k - 2 ( - 1 ) 々)。 

对于一般的线性递推式 A == +…+ a d x n - j , 我们可以通过计算一个适 

当的 dXj 矩阵的 n 次方，以 0 U 3 log n ) 次算术运算来计算[这个发现属于 J . 

C . P . Miller 和 D . J . Spencer Brown , Comp ./• 9 ( 1966 ) ，188〜190 ] 。事实上，如同 
Richard Brent 已经注意到的那样，如果我们首先计算 mod ( x d ~ — 1 -…- 

~)，而后以七代替 V ，利用习题 4. 7-6,运算的次数可以减少成 0 ( d 2 log / z ) 或者甚 

至减少成 0 (d log d log n )。 

27 . 要求 5 个小步的最小的 rz 必须是对于某个 r 的 c ( r )。 因为如果 C ( r )<72< 

c ( r + 1 ) ， 我们有 Z (72)- A (7 zXr - A ( c ( r )) = Z ( c ( r )- A ( c ( r ))) 0 对于 1 < 5 < 

6，答案因此是3，7,29,127,1903,65131;大概 c (28) 将要求7。 

28. a ) :^^3； = 2 \/ 3；\/(2 + 30，其中1”是逻辑“或”，参见习题 4.6.2-26; 显然 
v (: cV 3； Xi >(: cV ： y ) + p (: cA ： y ) = p (: c ) + y (: y )。 b ) 首先注意对于 l < i < r ， A t __； i / 

2 d i - y ^ A i / 2 d i o 其次，注意在一^个非加倍中心= 3^;因为否则 a { - a } + a k 

二 a iG 因此 AaGAh /2^ — 义。 c ) 对；的一个容易的归纳法，只是对结 

束步需要更仔细注意。如果在 m 的二进表示中所有的1全都出现在一行中大于等 
于 a 的连续的块区中，我们就说 m 有性质 PU )。 如果 m 和/^有尸心），则 m\J m f 
也有 PU ); 如果 m 有 PU ) 则 〆 m ) 有 P(a + 幻。因此氏有 P (1 +以)。最后如 
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果 m 有 P ( a )， 则 + 对于 ^(772) = 1^ 十…十〜，其中每个 

块大小 因此 . S ) + …+ (% + (^)^(1 + S/oOh + …+ 

(l + ^/ a )%。 d ) 设/=6, + ~是非加倍的个数， s 是小步数。如果/>3.271 lgy ( n )， 
则由 （16) 我们有所求的 s>lg ,( n ) 0 否则对于 0< z < r 我们有 a z <(l + 

因此？ 2<((1 + 2—勺/2)~2 '且 r>lg n + b r ~ 6 r lg ( 1 + 2 ~ 5 )^lg n + 

lg v ( n ) - lg(l + ^ c r ) - b r lg ( 1 + 2 — 6)。 设々 =「 lg (/ + 1) 1; 则 ln ( 1 + 2~ ^)^ ln ( 1 + 

1/(/ 十 l ) Xl /(/ + lX 5 /(l + 5/)， 而且由此得出，对于 （ X : r < /, lg (1 + 8 x ) + 
( f~-r ) lg ( 1 + 2 _<5 )^ lg(l + Sf ) 0 因此最后 / ( n)^lg n +lg v ( n ) ~ lg ( 1 + 
(3.2711 g p (/ 2 ))「 lg(l + 3.271 lg v (/2))1) 0 [Theoretical Comp . Sci . 1 (1975) ， 1 〜 
12 。] 

29 .在刚才引证的论文中， Sch 6 nhag e 改进了习题 28 的方法以证明对所有的 ri ， 
/( n)>lg n + lg u ( n )-2 A 3 0 剩下的缺口能够弥合吗？ 

30.72=31 是最小的 例子； /(31)=7,但1,2,4,8，16,32,31是长度为6的一个 
加减法链。[在证明了定理 E 后， Erdos 指出对于加减法链同样的结果也成立。 
Schonhage 已经把习题28的下限扩大到加减法链，并且像在习题4 . 1-34 中所定义 
的那样，用 PU ) 代替 v ( n )。 基于该习题的表示当同时给出： r 和:^ 1 时，可以给 

出对于乘幂的推广的自右至左的二进方法，它使用 X ( n ) + H ( n )~ l 次乘法。] 

32. 见 Discrete Math . 23 ( 1978)，115 〜 119。[这一开销模型对应于通过算法 
4 .31 M 那样的经典方法对很大的数做乘法。 D . P . McCarthy , Mafh . Comp. 46 
(1986), 603〜608已经得到其开销为（~以）〃 /2 的一个更一般的模型的经验 结果； 当 

两个72个二进位的数以 OU 0 步相乘时，这个模型更接近于 4.3.3 小节中的“快速 
乘法”，但是开销函数 a } a 1 实际上将是更合适的（参见习题冬 3. 3-13)。 H . Zan - 

tema 在步骤 z 的开 销是％ + q 而不是时，已经分析了类似的 问题；参见 /. Aigo - 
ririims 12 (1991),281 〜307。在这种情况下，最优链有总开销 |v n + O U 1/2 ) 。而且 

当 n 是奇数时最优的加法开销至少是 |~U -1)，且等于它当且仅当 n 可以写成形 
如 V 十1的数的一个乘积时。] 

33. 八 个； 有四种方法计算39 = 12+ 12+ 12十3和两种方法计算79 = 39 + 39 + 

lo 

34. 这个命题是真的，在二进链的归约图中的标号，对于々= e D ，•••，()是 LW 2 A 」 ; 

在对偶图中它们是1，2,…，2%。[类似地，习题9的自右至左的 m 进方法是自左至 
右方法的对偶。] 

35. 2^等价于二 进链； 如果0 = 6 1 + 1，它将是2〃 1 。等价于算法 A 方案的链数 

是计算《+ 2个数之和（其中有两个数相同）的方法数。这就是|/, + 1 + |/,，其中 
九是计算 m + l 个不同数之和的方法数。当我们考虑可交换性时，我们看到 九是 
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2 i 乘 （m + 1)! 乘 m 个节点的二叉树的个数，所以 / m = (2 m - 1) (2 m - 3) …1。 

36 . 首先对于使得和 q +…+ 的所有指数序列，构造 _ m _ 

1个乘积 • r ; 1 D 令〜= ( 心…4 4 )2 ;为完成计算，取…，然后平方 

之，而且对于 f = A - l ， …，1，0乘之以 xf 1 ， …：^ n 。 [ Straus 在 AMM 71 ( 1964 ) , 807 

-808 中证明，通过像在定理 D 中那样，把这个二进方法推广到 Y 进制中，对于任 
何 r >0,2 A ( n ) 可以用 （1 + OAU ) 来代替。] 

37. 首先对于计算2%然后用/进的方法的下列变形，计算每个 

对于所有奇的在至多 L + k 叫步内，计算 f q ^^\2 kt + e \ d t ^ Tq \, 
其中72 =(…44)2、然后在顶多另外的 Sz ( g ) +2& _1 步内计算 n = 2 g / g ，每个％ 

所需的步数 < L ~^~ lg ”」+0(々2&)，而且当^ = Llg lg ”― 3 18 1§1§72」时，这是；1(?7)/ 
AA ( 72) + 0{X(n) AAA ( n )/AA ( n ) 2 ) 0 

[定理 E 的一个、推广给出对应的下限。 参考 : SJCOMP 5 (1976)，100〜103。] 

38. 下面由 D . J . Newman 给出的构造提供了最近知道的最好上限 ：设々 = p '." 

九是头 r 个素数的乘积。在 Od bgM 步内计算々和所有二次剩余模々（因为 

有近似于2_乂个二次剩余）。并且在大约另外的 m 2 M 个步内，计算小于等于 m 2 
的是的所有倍数。 现在⑺ 个加法足以计算 I 2 ，2 2 ，…， m 2 。 我们有 A = exp ( p r + 

0( p r l ( log 久）_))，其中九由习题 4.5.4-36 中的公式给出；例如，参见 Greene 和 

Knuth yMath . for the Analysis of Algorithms ( Boston : Birkhauser , 1981) ， § 4 ■ 1 ■ 6。所 

以通过选择 


r = (1 十 ~ 2^ n 2 /lg lg th In ml In In m 

即得出 Z ( l 2 ,-**, m 2 ) = m + 0( m.exp _ (士 In 2 — ()In m/ln In m 

另 一 方面， D . Dobkin 和 R . Lip ton 已经证明，对任何 ( >0 ， 当 w 充分大时， Z ( l 2 , 
…， m 2 )>m 十 m 2l3( [SICOMP 9 (1980) ， 121 〜 ■ 125 ] 。 

39.量 l ([ n lf n 2 y t '' yn m ]) 是有向边数 - 项点数+ m 中之极小者，这里取遍所 
有如下的有向图，它有777个入度为0的顶点\及一个出度为0的顶点“其中对于 

，恰有~条由~到 Z 的有向通路。量 l ( n '， n 2 , …， 是有向边数-顶点 
数+ 1中之极小者，取遍有一个入度为0的顶点5和 m 个出度为0的顶点0的所有 
有向图，其中对于恰有 n ; 条从 S 到~的有向通路。如果我们改变所有有 

向边的方向，则这些问题是彼此对偶的。[参考 J . A / g * or/fhms 2 (1981) ，13〜21。 ] 

注： CH . Papadimitnou 指出，这是一个更为一般得多的定理的特殊情况。设 N 
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= (72^ 是没有全为0的行或列的非负整数的 mXp 矩阵。我们可以定义 /( N ) 为 
计算单项式集合 U 仂…工> 剡所需的最小乘法数。现在 /( N ) 也是有向边 

数 - 顶点数+ m 中极小者，取遍 m 个入度是0的顶点\和/)个出度为0的顶点~ 
的所有有向图，其中对于每个 z 和 j 恰有％ 条从^到~的有向通路。由对偶性，我 

/ f 门有 / ( N ) = L ( N T ) + m - p 。 [Bulletin of the Europ . Assoc . Theor . Comp . Sci . 13 

(1981 年 2 月 ），2 〜 3。] 

N . Pippenger 对习题 36 和 37 的结果作了很大推广。设 L ( m ，/)，72) 是取遍非 
负整数的所有 mXf 矩阵 N 的 Z ( iV ) 的极大值。则 L ( m ， p ， n ) = min ( m , 

p)\g n + Hj lgH +0 (m + /) + H (log log H ) 1/2 (log H ) 一 3 ’ 2 ) ， 其中 H = mp \ g ( n + 

1 )。[SJCOMP 9 (1980)，230〜250。] 

40. 由习题39,证明/ … + 7 n t n t Xl ( mi ， …， m t ) + / ([〜 ，…， 〜]) 即 

可。但这是显然的，因为我们可以首先构造 U 、， …，：丨，而后计算单项式 

注 ：表述 Olivos 定理的一个更强的方法是 ：如果 別，…，〜和 b 0 , …， b s 是任意加法 
链，则对于非负整数~的任何 （r + l ) X(s + l ) 的矩阵， 〆 2 c 户也 )< r +5+ E ~_ l 。 

41 . [SICOMP 10 (1981)，638〜646。]每当 A >9 m 2 时，可以证明所述的公 
式。由于这是 m 的多项式，而且由于求一个极小的顶点覆盖的问题是 NP 困难的 
(参见 7. 9节），故计算 〆 &，…， n w ) 的问题是 NP 完全的。 [ i 太算 Z ( n ) 的问题是否 

NP 完全尚不得知。但这样一点看起来是真的，即当 A 充分大时，对于比如说 

+ 的最优的链将要求对于，…，的最优的链。] 

42. 是的，如果 u ( 7? X 5; 见 Bahig 和 NaKamula , J . Algorthms 42(2002) ，304〜316。 

4.6.4 小节 

1 .置 y — x 2 ，然后计算（（… （ u 2n+ + u 2 n - i)y + …） y + ujx 。 

2 . 用多项式 x + xo 代替 (2) 中的 x 即得下列 过程： 

G 1. 对于々= n，n -1，…， 0( 以这个顺序）执行 G 2, 并停止。 

G 2 ■置 ％—而后对于 j _ = 々，々 + l ， •••，”-!■置 ％ — % + > 2 ：。 1 ^ + 1 (当 k — n 

时，这 一 步只是置 — w „)。 I 

这些计算同 HI 和 H 2 中的那些计算刚好相同，但是以不同的顺序执行。（这个 
应用事实上是牛顿原来使用方案 (2) 的动机。） 

3. ^ 的系数是 y 的多项式，它可以通过霍纳规则来求值 … （、， Q ：c + 

( 〜一 i ， i：y + u tl ^ Y ^))x + …）工 + (( … （ w 0 ，j + 以 0, 厂 i)：y + …）: y + w 0 , 0 )。 [对于一个 

“齐次”多项式，诸如 u n x n + — ^ +…+ u { xy n ~ 1 + w 。/， 还有一个更有效的 

方案 ：如果 0< |:r |<|： y | ，首先 x 除以 3S 求: r / y 的多项式的值然后乘以/。] 

4. 规则 （2) 包含 4 n 或 3 n 个实数乘法及 4 n 或 7 n 个实数 加法； （3) 是坏的，它花 

• 684 • 


4-6.4 小节 


费 472 + 2 或 472 + 1 个乘法 ，4 t 2 + 2 或 472 +5 个加法。 

5•用 一个乘法计算： r 2 ; LW 2」 个乘法和 LW 2」 个加法计算第 一行； 「 W 21 个乘法 

和「72/21-1个加法计算第 二行； 一个加法把两行加在一起。总共 72 + 1个乘法和 n 

个加法。 

6. J 1. 计算和存储值 xl f xl y -, x [ 0 nl2 \ 

J 2 •对于 (X j 置 Vj — w〆 。 - [ ”/ 2 」。 

J 3 .对于々= 0，1 ，…， n — 1，对 _;• = 72 - 1，…，々 + 1，々，置 v } — Vj + v j + 1 。 

J 4 ■对于置 ％ —%4” /2 」~。 | 


有 （ rz 2 + 72 )/2 个加法，72十「 n /2 l - 1 个乘法，72个除法。通过把％和抑当做特殊情 

况，可以节省另一个乘法和除法。参考 文献: SJGACTNews 7,3(1975 年夏），32〜34。 

7•设气= X 。+ j / i ，并考虑 （42) 和（44)。对于，置： y ; — w (：^)。 对于々 

=1，2，…，72 ( 以这个顺序），对于 j = n . n - 1，•• •，以 以这个顺序）置 y 广 y ] ~ yj-io 
现在对所有 j ， 置尽广％。 

然而，即使 （5) 的运算是以完全的精度完成的，但舍入误差仍会像在正文中所说 
明的那样\积累。当 （5) 是以浮点算术进彳了时，进彳了初始化的 一 个更好的方式是选择 

ft ， …， A 使得 





?0、 


^ u ( x 0 ) 、 


/ 、 

^0 

• 

_ 

— 

u ( x d ) 

辱 

鲁 

• 

+ 

參 

♦ 


• 

、 u ( x nd y 


# 

# 

、6/7 / 


其中 Uo I ， I，…，I 尽可能地小。 [ H . Hassler , Proc . 12 th . Spring Conf . Computer 
Graphics ( Bratislava:Comenius University ， 1996) ， 55 〜66。 _ 

8 .见 （43)。 


n 


9. [Combinatorial Mathematics ( Buffalo ： Math . Assoc , of America , 1963), 26 

这个公式可以看做容斥原理 （1.3.3 小节）的一个应用，因为对于 rz - fl - … 
= k 的诸项的和是 L 的 A 个值不出现的所有那些: c 1; 的和。注意到 


n 


的系数是 


1 ; 


nj 


rt 


S(-d 




n 


可以给出一个直接的 证明； 如果诸是不同的，则这等于1，但如果 71 ，…，九关々，则 
它为0 ,因为的项抵消^ = 1的项。 


为了有效地求和，我们可以从 q = = 0 开始，然后以下列方式遍历 

诸6的所有可能的组合，即从一个项进到下一个项时，仅有一个 f 发生变化（见第7 
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章中的 “ Gray 码”）。计算头一项的工作量是 n ~ l 个 乘法； 随继的2” _2项每一项 
需用 W 个加法，再用 n -1 个乘法，然后又一个加法。总共 (2”_1) U -1) 个乘法及 
(2" -2 )(n + 1) 个加法。仅仅需要?2 + 1个临时存储单元，一个用于主要部分的和， 

其余的用于当前乘积的因子（每个因子用一个）。 

\< k<nk (々十 1 j L 

-2” + 1 个加法。这近似于习题 9 方法的算术运算的一半那样多，尽管它要求更复 
杂的程序以控制执行顺序。必须使用近似于个临时存储单 

元，而且这将以指数的方式增大（阶为 2 n \^ Tn ) 0 

本题中的方法等价于由 Jurkat 和 Ryser ^£ J . Algebra 5 (1967) ，342〜357中给出 

的积和式函数的非通常的矩阵因子分解。 在一 种适当意义下，它也可以看做 （39) 和 

(40) 的 一 个应用。 

11. 如果矩阵是充分稠密的，则计算一个适当的值的有效方法是已知的，请参见 

A . Sinclair , Algorithms for Random Generation and Counting ( Boston : Birkhauser ， 

1993)。 但这个问题要求精确的值。对于某个 c <2 可能有一个方法以0( 〆 ）次运 
算来计算积和式。 

12. 下边是关于这一著名的研究问题的进展的简要概述： J . Hopcr ^ ft 和 L . R . 
Kerr 在其它场合证明了，在 2 X 2 矩阵的乘法中，需要7个模2乘法 [SJAW J . App /. 
Math . 20 (1971)，30〜36]。 R . L . Probert 证明，所有7个乘法的方案中必须至少有 
15个加法，在这种方案中每个乘法取一个矩阵的元素的线性组合并乘以另一个矩 
阵的元素的线性组合 [SJCOMP 5 (1976),187 〜203]。在每个域中 2 x 2 矩阵乘法 
的张量的秩是 7[ V . Y ^ nJ . Algorithms 2 (1981) ，301 〜 310] ;2 x 3矩阵和3 x 2矩 
阵的乘积的张量，即 T (2,3,2) 的张量，其秩是11 [ V . B . Alekseyev J .Algorithms 6 
(1985) ，71 〜 85]。当 72 =3时，对于 乂 n 矩阵乘法，已知的最好方法是 J . D . Lader - 
man 给出的 [ Bull . Amer . Math . Soc . 82 (1976) ， 126 〜 128 ] ， 他证明 23 个非可父换的 
乘法就足够了。他的构造已为 Ondirej Sykora 所推广 ， Ondrej Sykora 给出了需要 

_ (n - I ) 2 个非可交换的乘法和 ~ n 2 + ll ( n - l ) 2 个加法的方法，这个结果当 
n = 2时可归结为 (36) [Lecture Notes in Comp . Sci . 53 (1977) , 504 〜 512 ] 。 对于 
n =5,当前的记录是 100个非交换的乘法 [ O . M . Makarovl ^ L / SSi ^ Comp . Math , and 
Math . Phys . 27,1 (1987)，205 〜 207] 。迄今为止已知的最好下限是由 J._C Lafon 和 
S . Wmograd 给岀的，他们证明， 2 t 7 2 _1 次非纯量的乘法是必须的，而且在 mX n X s 

的情况下是 7?2 72 + ns + in ~ n — 1 _ A Lower bound for the multiplicative Complexity of 
the product of two matrices , Centre do Calcul , Univ . Lonis Pasteur ( Strasbourg , 

1979)]。 如果所有的计算都须不用除法进行， N . H.BshoutytSJCOMP 18 (1989)， 
759 〜 765] 得到稍微更好的下限，他证明当时 ， m X ”乘以” X ;的矩阵 

乘法 mod 2至少需要 斯>72士」十 + ( ?2 + ( ” mod j))(n ~ (n mod j ) ~ j ) ^ 
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n mod j ■次乘法；置 ？?z = n = i . 和 77给出 2 .5 n 2 ~ -^-n lg ” + 0(? z) c 

关于对于很大的 n 已知的最好的上限，在 （36) 之后的正文中作了讨论。 
13.通过对几何级数进行求和，我们求得，…，〜）等于 



O^S % < 772 


» ■ ■ 


• 0^5 < m 


exp ( 


27 ii( s \t m i 




s ?l t ri l m 


n 



6 


S”））l 





n 


n 


n 


通过进行一个正则变换，而且当时交换 


和 
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，可以求得逆变换乘以 


m 


7 n n ；参看习题 4.3. 3~9 o 


[如果我们把 F (“ ，…， ~)当做多变量多项式中 xV - - * 的系数，则离散傅里 

叶变换相当于求这个多项式在诸单位根处的值，而逆变换相当于求内插多项式。] 

14 ■设 …= m „ = 2 ，F (“， t 2 ，•••“„) = F (2 n ^ 1 t v + •■- + 2 t 2 + q )，/( 5 !， 

k ， …， + 2”- 2 巧+ … +〜）；注意诸 i 和诸 s 之间的反演处理。并设 

A (〜，••■，〜，&)是⑺取 2 k ~ [ t k ( s n 十]、-! +…十厂―、）次方。 

在每次迭代时，我们实际上取2”- 1 对复数 UJ )， 并用 （a + ^, a - 明）代替它 
们，其中 <是~的适当的幂，因此对某个^ C = cos 3 + i sin 6。如果我们在 （= 土1 

或 ± i 时利用化简，则全部工作就成为 （U -3 )_y 1 +2) 次复数乘法和77 *2” 次复 
数 加法； 习题41所用的一些技术可用来减少为实现这些复数运算所需要的实数乘 
法和加法。 

对于6 = 1，3^，把第々次和第々+ 1次扫描结合起来，可以把复数乘法的次数 
减少大约2596，而不改变加法的 次数； 这意味着 y 2 个四元组 （a J ,、/， 幻为 U + 印 

+ ^ 2 7 + , a + i ^/3 - ^ 2 J ~ \ d , a -⑶ f 2 7 ~5 ， a — i 以-7十 iS ) 所代 

替。因此当 n 为偶数时复数乘法的次数减少为 

这些计算假定，给定的数 F (0 是复数。如果 FU ) 是实数，则/(0是/(2”-0 
的复共轭，所以通过仅计算2” 个独立的实数 /(0),5 R /(1), - 1), 

/(2”_ 1 )，容/(1)，〜，§/(2”- 1 -1)，我们可以避免冗余性。在这种情况下整个计算 
可以通过对 2" 个实数进行运算，并利用当 （ V 、） 2 + ( 〆 ! … 4 ) 2 =0( modulo 2” 时 


fk Q $ n - k 


+ 1 ， 




t 


n 


k 


) 将是 f k W n - 


^ + i 


s 


n 


1 


n ~ k 


) 的复共轭这一 


事实来完成。大约需要在复数情况下的乘法和加法次数的一半。 

[快速傅里叶变换的算法是由 C . F . Gauss 于1805年发现的，而且自此以后，已 
许多次被独立地重新发现，最著名的是 J . W . Cooley 和 J . W . Tukey 的发现， Math . 
Comp . 19 (1965),297 〜301。它的有趣历史已由 J . W . Cooley , P . A . W . Lewis 以及 


P . D . Welch , Proc . IEEE 55 (1967), 1675 - 1677； M . T . Heiderman , D . H . Johnson 以 


及 C . S . Burr us , IEEE ASSP Magazine 1,4(1984 年 10 月 ），14 〜 21 作了回顾。有关 
对于它的使用的细节已由数百个作者作了讨论，而由 Charles Van Lon 作了精彩概 

yComputational Frameworks for the Fast Fourier Transform ( Philadelphia : SIAM , 

1992) o 关于有限群上的快速傅里叶变换的概述，请参见 M . Clausen 和 U . Baum , 


Fast Fourier Tarn forms ( Mannheim ： Bibliographisches Institute Wissenschaftsverlag , 
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1993)。] 

15. ( a ) 提 7 K 由积 分和归纳得出。设当0由 min (: r 0 ，…，: r ，,） 变化到 max ( j : 0 ，…， 
: rj 时， / U ) (们取 A 和 B 之间（含）的所有值。在所述积分中，用这些界的每一个代 
替/”），产生 Aln \< fU 0 ，."， xJ<BlnL ( b ) 只须对于 j = n 来证明这一点就够 
了。设/是牛顿内插多项式，则 / ( rj ) 是常数72!^。[参见由 D . T . Whiteside 编辑的 

The Mathematical Papers of Isaac Newton , 4 (1971) ,36 〜 51,70 〜73。 ] 

16 . 如同对多项式的运算那样进行 （43) 的乘法和加法。（习题2中考虑了 o：o = 
心二…的特殊情况。在算法 4.3.3 T 的步骤 T 8 中我们已经使用了这一方 
法。） 

17. 例如，当 n =5时，我们有 


^0 


5^1 , 10^2 

十 


10^3 + 5^4 


^5 
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[5] (工） 
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工0 
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^2 
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工3 
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工4 
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工5 
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10 


10 


+ 
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工0 


X 


^1 


X 


^2 


X 


工3 


X 




X 


工5 


独立于 / i 的值。 


18 • a 。 




2 


( 以 3/“4 + 1 )，夕二 U2IU4 ~ ao(aQ — 1) y ai 二 aQp — u J u 4 ， a 》 二曰 _ 2a 


^3 = UqI U4 — a\(a[ + ^ 2 ) ，以 4 = U4 o 

19 .由于 a 5 是前导系数，不失一般性我们可以假定 以: r ) 是首一的 （SP W5 = l ) 0 
于是 G ：0 是方程40 Z 3 — 24 u 4^ 2 + ( 4^4 + 2 H Z + (“2 — ^3 ^4 ) = 0的根；这个方程总 
是至少有一个实根，而且还可能有三个实根。一旦确定了 a Q ， 我们就有 a 3 = 

4 a 0 = u 3 - 4 a Q a 3 - 6 a ] y a 2 - u {- a 0 ( a 0 ai + 4 ala 3 + 2 a Y a 3 + al ) y a 4 = u 0 - 

a 3 (al + a Y al + a 2 ) 0 

对于给定的多项式，我们来解三次方程 40 z 3 - 120 z 2 + 8(^ = 0;得到三个解 
( a 0 , o ^， a 2， a 3 ， a 4 ， a 5 ) = (0, - 10,13,5, - 5， 1) ， （ 1，- 20,68,1 ,11,1) , (2, - 10,13, 

-3,27，1)。 


20. LDA X STA TEMP2 FADD = = FMUL TEMPI 

FADD = ^3 = FMUL TEMP2 FMUL TEMP2 FADD = a 4 = 

STA TEMPI STA TEMP2 FADD = « 2 = FMUL = a 5 = | 

FADD = _ a 3 = 

21. z~(x^l)j ： -2yW~ (x + 5)z + 9 ， w( ： r) = (w 十 z ~ 8) zv _ 8; 或者之 = 
(x 十 9):r + 26, w = (x — 3)2 ： + 73, w (x) = {vu + z — 24)zt> _ 12 。 

22. a^ — 1 y aQ~ — 1, a ] = 1, /?i = — 2, 夕 2= —2 ， /?3 二 — 2,/? 4 = l,a3 = _4,of2 = Q ， 

a 4 — 4 ? a^~ _ 2 。 我们构造 之二 （ :r _ l):r + l，w = 2 ； + x ， 以及 u (x) — ((z — x _ 4) ' 

w + 4)z - 2 。在这种特殊情况下，我们看到，如果我们计算 zv = x 2 + 1,z = zv~j:, 
则可以节省 7 次加法之一。 
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23. a) 我们可以对 n 用归 纳法； 如果 n <2,则结果是不重要的。如果/(0)=0, 
则这个结果对于多项式 /U)/z 为真，所以它对 /(z) 成立。如果对于某个实数 y 关 

0，/(oO = 0, 则&(±以）=/1(±卜）=0 ; 由于此结果对/(之）/(之 2 + /)为真，它对 

/U) 也成立。因此我们可以假设 /U) 没有其实部为零的根。而给定通路绕原点 
循环的净次数是/(幻在这区域内根的个数，故它至多为1。当尺很大时，对于 tt/2 
<^<3 tu /2 的通路 /( 只 e〃） 将以顺时针的方向绕原点近似于 n/2 次； 所以对 于-只 < 

，通路 /(iO 必然是以反时针方向绕原点至少 W2-1 次。对于77是偶数，这意 
味着 /(i《） 至少穿过虚轴 rz- 2次，至少穿过实轴 n-3 次； 对于 n 为奇数， /(iO 至 
少穿过实轴 n -2 次，至少穿过虚轴 n -3 次。这些分别是 g(iO=0，/i(U) = 0的 
根。 

b) 若否，则^■或 A 将有形如 a +纟 i 的一个根，且和 b ^ Oo 但这将意味着 
至少存在二个其它这样的根，即 <2 - 以，和-<2±以，而 g(2：) 和 /i(^) 至多有 n 个根。 

24. w 的根是-7, - 3±i，- 2 土 i，-1; 可以允许的 c 值是2和 4( 但3不是，因为 
c = 3 使得根的和等于0)。情况 l，c —2： p ( x ) = (x + 5) ( x 2 + 2 x 2) ( x 2 + 1) (x — 

1) =工 6 + 6:c 5 + 6x 4 + 4x 3 ~ 5 x 2 — 2 x — 10; q ( x ) = 6 x 2 + Ax — 2 = 6( jo + 1)* (工-冬、。 

3 / 

设 a 2 = _ 1 , a\ = ; pi ( x ) = 工 4 + 6 x 3 + 5 x 2 - 2 x - 10 = 

/ . 16 W ^ 1 \ 74 16 74 

卜 + 6x + y j - yJ--^-;ao = 6,/5 0 = y ,^ i = - y 。情况 2， c =4: 类似的分 

析给出 a 2 = 9, a l = -3, a 0 = -6，汍=12，仏= —26。 

H = a 2 y ^i — 2 a x ^ «7 , ^4 = q ： 6 ，々 5 ~ ^6 = 0 , ^7 = a \ , ^g = 0 , = - ago 

26 .(a)Ai = aiXA 0 , 久 2 = q ：2 + 入 1 ，入 3 = 入 2 乂 A o > A 4 = ^3 + 入 3 ，久 5 = 义 4 / A o , A 6 = a 4 

+ A 5 。 （ b)/^ = 1 + Ax ， /C 2 = 1 + ft/Cj X ，/ C 3 = 1 + ^K 2 X , U(X) = p 4 K 3 = i^ 4^ 3 

+ + ^40 ( c ) 如果任何系数为 0 ,则在 （ b ) 中： r 3 的系数也必为 0 ,而 

( a ) 就产生了次数<3的任意多项式 a \ X ^ + « 2 工 2 + a # + q 。 

27. 否则对所有实数的集合（〜，…， 9 l ， g Q ) 将有整系数的非0多项式/(〜，•••， 
hjo ) 使得 q n . f ( q ”’“.， qi ， q Q ) = 0。 但这不能发生，因为由对 72 的归纳法容易证 

明，一个非0的多项式总是取某个非0的值。（然而，参考习题 4.6. 1-16,这结果对 
于有限域而不是实数说来，是不成立的。） 

28 . 中间量 〜，•••，〜 形成多项式整环 Ql ；^ ，…，〜] 的代数基，其中 Q 是有理数 
域。因为 s + 1 大于在一个基中的元素个数，故多项式/ ; (^，…，^)代数 相关； 这意 
味着有一个有理系数的非 0 多项式 g 使得 W / oG ! ，…，〜），… ，乂 （ 0 ^ ，…， 〜）） 恒等 

于 0 。 

29. 给定 j 0 , …， 10，1，…， n | ，存在整系数的非0多项式，使得对于 Rj (1 <j 
) 中的所有（〜，…， g 0 ) ，都有 幻 （ ％，…，％ ) = 0 。因此对于尺 1 U … U 中所 

有的（么，…，训），乘积 g ! g 2... g m 都为 0 。 
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30•由定理 M 的构造开始，我们将证明有 (1- ) 个/?可以有效地消 

厂 c 

去： 如果内 对应于 一 个参数乘法，则我们有内 = Pli - i X (了 2 z + ) ;把#2 ; - 1 加 

到在7；中出现的每个色上，并以0代替/? 2/: 。这对每个参数乘法删去一个参数。 

如果是头 一 个链乘法，则内 = (hJC +心+ ft , - 1 ) X ( 72工+没 2 +卢 2 ,. ) ，其中 A ， 
Y 2.0^ d 2 是整系数的仏，…，心- 2 的多项式。这里义和％分别被“吸收”到 P 2i - { 
和 ft ,中，所以我们可以 假定心 =% = 0 。现在把 cfe _ i ft ,加到％在 1 中出现的每 
个 ft 上；把 Pn - xYiiyi 加到 ft , 上；并置成 0 。除使得为 0 的 a ，… ，〜的 
那些值之外，消去/? 2 / ^不会改变结果集。[这个证明实质上墓 V . Y . Pan 给出的，见 
Uspekhi Mat . Nauk 21,1(1996 年1月一2月），103〜134。 ] 后一种情况可以像在定 
理 A 的证明中那样处理，因为具有 7 2 = 0 的多项式可通过消去/? 2 / 来求值(像在头一 

个构造中那样，其中^对应于一个参数乘法）。 

31.否则我们可以增加一个参数乘法作为最后一步，因而违背定理 C 。 （在这种 
特殊情况下，本题是对定理 A 的改进，因为在72次首一多项式的系数中仅有 n 个自 
由度。） 

32 . A | = A q X A 。，》〗 = a ) X 义1，义3 = a 〗 + ;、2，义4 = 义3 X Ai ，》5 = + 久4。由定理 

A ， 为计算 u 4 x 4 我们至少需要三个乘法（见 4. 6 . 3小节），并且至少需要两次加法。 

33 .我们必须有 n + 1^2 / n c + m p + ，以及 〜+〜= (n + 1 )/2 ;所以没有 

参数乘法。现在其前导系数（作为、 r 的一个多项式）不是整数的头一个 A z ，必须通 

过一个链加法才 得到； 而且至少必定有 n + 1个参数，所以至少有72 + 1 个参数加 

法。 

34. 逐步变换给定的链，还定义的“容度” C / 如下 ：（ 直观上， q 是&的前导系 
数。）定义 6'0 = lo ( a ) 如果此步有 A ； = ^ + 的形式，则以 A , = ft 十代替它，其中 
/?； = a 〕 lc k ;并且定义= 4 。 （ b ) 如果此步有 A , : 二 a 』 _ A k 的形式，则以 A ,. =爲+ A 々代 
替它，其中 ft = - otjc k •， 而且定义 c z = - c k 。 ( c ) 如果此步有 A z _ = ~ X 的形式，则 
以 A ; = 代替它（此步稍后将被删去）；并定义<: ; = a } c k o ( d ) 如果此步有= Xj X 
h 的形式，则使它保持不变，并定义 c v = c / 7 , o 

在这个过程完成以后，删去形如 A , = A , 的所有步，在使用 A , 的每个未来的步中 
以代替 A ;。 然后增加一'个最后步 A r + J = /? X A r •，其中/? = ~。这就是所求的方案， 
因为容易验证新的 A 2 恰巧是旧的那些除以因子 q 。 诸/?是诸 a 的给定 函数； 不会有 
除以 0 的问题，因为如果任何 c , = 0 , 则我们必然有^. = 0 (因此/的系数为 0 )，否 
则 A &绝不对最后结果做出贡献。 

35. 由于至少有五个参数步，所以结果是平凡的，除非至少有一个参数 乘法； 考 
虑用三个乘法可以构造的方式，我们看到，必定有一个参数乘法和两个链乘 

法。因此四个加减法必须每一个都是参数步，而且可应用习题34。我们现在可以 
假定仅仅使用加法，而且我们有一条链来计算一般的首一四次多项式，这条链包括 
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两个链乘法和四个参数加法。计算四次多项式的这种类型惟一可能的方案有形式 

A j = a L + Aq 

义 2 = + A 0 

― AI x A 2 



又 7 = A + A 6 

实际上这条链多做了一个加法，但是如果我们把某些 a 限制成为其它的 a 的函数， 
则任何正确的方案均可表示为这个形式。现在入 7 有（: c 2 +Ai + B )(: r 2 + Ax 十 C ) 

+ D = x 4 2 Ax 3 + ( £ + A 2 ) x 2 + EAx + F 的形式，其中 A = q + a 2 , -B = ct l a 2 + 


a 3 ， C = a 1 a 2 + a 4) D ~ a 6 , E = .B + C , F = EC + D ; 而且由于这仅仅包含三个独立的 

参数，因此它不可能表示任何一般的首一四次多项式。 

36 J 卩同在习题35的解中那样，我们可以假设这条链仅仅使用三个链乘法和六 
个参数加法来计算一般的六次首一多项式。这个计算必须采取两个一般形式 之一： 

A 工二 “I + 又 0 ~ cfj Aq 



又 3 = 



A 1 x A 2 






0 






A 

A 







A 10 = O'7 A9 义 10 = ( ^7 十 /\9 

其中，如同在习题 35 中一样彡已经插人一次额外的加法以包括更一般的情况。这两 
个方案中没有一个能计算一^的六次首一次多项式，因为头一种情况是形如 

( x 3 十 Ax 2 + Bx + C )( x 3 + 十 B：r 十 D ) + 

的一个多项式，而第二种情况是形如 

(工 4 + 2 Ax 3 + (E + A 2 ) x 2 + EAx + F )( x 2 + Az + G ) + H 

的多 项式； 这两者都仅含五个独立的参数。 

37 .设 Pq ( x ) = u n x n + i i + …+ w 。和 z % 】义” + … + 

叫。对于九— i (: r ) 除以首一多项式义—“工），得到 p j - { { x )^ a j q j . x ( x ) + 

如(工 ）。假设满足这一关系的 n~j 次首一多项式 存在； 这对于几乎所有有 
理函数都将是真的 c 设 pjix ) - Oj - iijr ) - .rvqj ( X ) 。 这些定义意味着 deg ( p n ) < 
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\ 


1 ，所以我们可以设 A +1 = A ( X )。 

对于给定有理函数，我们有 

j «； ft. qj(^) Pj (^) 

0 x 1 + Sx + 19 :c 2 十 lOx + 29 

1 1 2 : r + 5 3x + 19 

2 3 4 1 5 

所以 u ( x)l v ( x ) = p 0 ( x)l q Q ( x ) = 1 + 2 l (x + 3 + 4/( j : + 5))。 

注 ：具有 上述形式的一般有理函数有 2〃 + 1 个实质上独立的参数，在此意义下， 
它有2〃 + 1个“自由度”。如果我们把多项式链推广成算术链（它允许进行加减乘运 
算，也允许进行除法运算 ）（ 参见习题71)，则稍微修改定理 A 和 M 的证明即可得到 
T 面的一些结果 •.一 条具有 q 个加减法步的算术链，至多有 q + 1 个自由度 。—条具 
有 m 个乘除法步的算术链，至多有 2 m + 1个自由度 。因此一条计算几乎所有具上 
述形式的有理函数的算术链，必然至少有2〃 个加减法，以及 n 个乘 除法； 本题中的 
方法是最优的。 

38•如果 n = 0, 则这定理肯定是真的。假设 n 为正，而且给定了计算 P ( x ; 
W ， …，〜）的多项式链，其中每一个参数义都已为一个实数所代替。设 A 2 = X A , 

是头一个涉及 wo ，•*•，、之一的链乘法；由于 A 的秩数，这样 一 步必定存在。不失 

一 般性，我们以假设涉及;于是， A ; 有 Aq + … + h n u n + /(: c ) 的形式，其中 

h Q ，…， h ” 是实数， 心 关0,而且 / U ) 是实系数的多项式。（诸 A 和 / U ) 的诸系数从 

赋予诸 a 的值导出。） 

现在把步骤2变成 A 4 = aX A ,， 其中 a 是任意实数。（我们可以取《 = 0 ;这里使 
用一般的 a 只是说明在证明中可以有某种程度的灵活性。）增加一些步骤来计算 

A = (a _ f ( x ) - h 0 u 0 _ h n . x u n - X )/ h n 

这些新步骤仅仅含加法和参数乘法（乘以适当的新参数）。最后，在这条链的任何地 
方以这个新元素代替结果是计算 

Q(x , u n ^ x ) = P(jc ; u 0 ，-■- , u n . y , (a - f ( x ) - h 0 u 0 _ … - hh )! h „) 

的一 条链； 而且这条链少一个链乘法。如果我们能够证明 Q 满足假设，则这个证明 
即告完成。 量 ( a - fU )) lh „ 可能使 m 的值增加，还导致新的向 量矿。 如果 A 的 

诸列是，…， A „ (这些向量在实数上是线性无关的），则对应于 Q 的新矩阵 A ' 有 

列向量 

A 。 - ( h 0 / h n ) A n ,…， - ( h n . l ! h n ) A n 

也许要加上一些0的行以说明 m 增加值的原因，而且这些列显然也是线性无关的。 
由归纳法，计算 Q 的链至少有〃 -1 个链乘法，所以原来的链至少有 n 个链乘法。 

[ Pan 还证明使用除法不给出任何改进；参 考 Problemy Kibernetiki 1 ( 1962 ) , 21 

〜 30 Q S . Winograd 已经给出关于若干个变量的好些个多项式计算的推广，包括带 
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和不带各种类型的先决条件在内，见 Co / nm . Pure and Applied Math . 23 ( 1970), 165 
〜 179 0 ] 

39 . 对 m 用归纳法。设 = + i + …+ w ' — “上）： 

x2m 2 + v 2 m - 3 x2m 3 + … + *^0 ， a = q 十 ； ， 6 = a 川 ，并设 

/■( r ) = 2,,分。(-1)’. + 十；卞+, + 2 〆 " 

由此得出，对于 r >0 ,tv = /( r 十2)，而且1=/(1)。如果1=0,而且 a 是给定 
的，我们就有6的 m - 1次多项式，而且前导系数是± U 2rn _ r - 臟）=± ( 72 +…+ 

7 m ~ rny m ) 0 

在 Motzkin 未发表的笔记中，他通过选择诸 y 使得这个前导系数当 w 为偶数 
时不等于0,当 m 为奇数时等于0,做到了使心几乎总是等于0;因此我们几乎总是 
可以让6是一个奇次多项式的一个（实）根。 

40 . 否； S . Winograd 找到了只用7个（可能是复数的）乘法来计算所有 13 次多项 
式的方法 [ Conrni . Pure anc / Appi/ecf Math . 25 ( 1972) ， 455 〜 457] 。 L.Revah 找到了 

一些方案，它们用 Ln /2」+ l 个（可能是复的）乘法来计算几乎所有 72 >9次多项式 
[SICOMP 4 (1975), 381 〜 392]; 她也证明了，当 tz = 9时有可能仅仅通过至少 n +3 

次加法就实现 LW 2」 + 1次乘法。通过附加充分多的加法（参见习题39)，可以删去 
“几乎所有”和“可能是复的”这些附带条件。 V . Y . Pan[STOC 10 (1978) ，162〜172; 

IBM Research Report RC 7754(1979)] 发现了对于奇的打>9，使用|_打/2」+ 1 个（复 
的）乘法和极小数为” +2+心 9 的（复）加法的一些 方案； 对于 n =9他的方法是 

= ((x + a) 2 + p)(x + /) , w(x) = v(x) + x 
= (v(x) + d^iwix) + ^), t 2 (x) = (v(x) + d 2 )(w(x) + ( 2 ) 

u{x) = (r t (^) + ^)(t 2 (x) - ti(x) + 7)) + K 

对于 当（实）乘法的极小数被达到时，所必需的实加法的极小数仍然是未知 

的。 

41. a(c + ( i ) - (a + b ) d + i ( a(c + d ) + (b ~ a ) c ) 0 [注意数值的不稳定性。 
三次 乘法是必要的，因为复数乘法是 p ( u ) = u 2 + l 时 （71) 的特殊情况。如果没有 
对加法的限制，就还有其它可能性。例如， Peter Ungar 于 1963 年提出了对称的公 
式 ac _ bd + i((a + b、（c 十 d )_ ac - M ) ; 等式 4.3. 3- (2) 是类似的，并用代替 i 。 
见 L Mumo ySTOC 3 (1971) ， 40 〜 44; S . Winograd [Linear Algebra and its Applications 

4 (1971),381 〜 388。] 

或者，如果 a 2 + 6 2 : l 及! = (1-幻/6 = 6/(1 + ^)，则用于计算乘积（^ + b\)(c 

+ di ) _ 以 + i 幻的算法 zv ~ c ~ td i v ~ d J r bzv , u = vo — 如”已由 Oscar Buneman 提 

岀 [/. Comp . Phys . 12 ( 1973 ) , 127 〜 128 ] 0 在这个方法中，如果 a = cos 沒和6 = 
sin 0，则我们有 f = tan (<9/2)。 

Helmut Alt 和 Jan van Leeu ^ en[Computing 27 ( 1981 )， 205 〜 215 ] 证明了，为计 

算 l /(^ + ^ i ),4 次实数乘法或除法是必要的，为计算 
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习题答案 


a _ _ a _ . (cl b ) a 

b + c \. b + c(cl b ) 1 b + c ( c ! b ) 

4 次就足够了。为计算 U + b\)Kc + di ) y 6 次乘除法运算和三次加减法运算是必要 
和充分的。 [ T . Lickteig , S/COMP 16 (1987) ,278-311 0 ] 

尽管有这些下限，人们应当记住，复数运算不必借助于实数算术实现。例如，为 
乘两个 n 位复数所需时间，利用快速傅里叶变换，渐近地只大约是为乘两个72位实 
数的时间的两倍。 

42 . (a) 设 7： 1 , ■■■ , 7z m 是对应于链乘法的诸 & ; 则々 = 尸 2/ - t x 尸 2/ 和 u(x) = 

，其中每个 Pj 有色 + 民 0 工 + 心 〜+…+ ⑺的 形式，其中 j/2^ - 1 

而且每个 ft 和知 都是诸 a 的整系数多项式。我们可以系统地修改链（参考习题 
30) ，使得对于，/^ = 0和 ^ jr ( j ) = 1;而且我们可以假定/?30 = 0,得到的集合 
现在至多有 m + 1+ Ef ? =\ ( r 7/21'1)= 州 2 十 1 个自由度。 

( b ) 任何这样的至多具有 m 个链乘法的多项式链可以通过具有 ( a ) 中考虑的形式 
的链进行模拟，除非对于+ 1，我们现在命 r (;) = r ；/2 l _ 1，而且我们不假定 
/? 3 o = 0 或对于⑺=1。这个单典型形式涉及 t ?2 2 +2 m 个参数。当诸 a 跑遍所 

有整数以及当我们跑遍所有链时，诸 P 跑遍至多 2 w2 + 2 w 个模2值集，因此得到的集合 
也是如此。为了获得带有 0 _ 1 系数的所有2” 个?？次多项式，我们需要 m 2 + lm > n 0 

( c ) 置 」并计算: c 2 ，上 3 ，… W 2 0 命 u ( x ) = u m + 1 ( j ：): r( m + 1 ) w + …+ 

+ 〃 Q (: r )， 其中每个~(幻是次数<讲的整系数多项式（因此它可以被求 

值而不需要任何进一步的乘法）。现在用规则 （2) 把作为具有已知系数的 
的多项式来计算（所用的加法次数近似于系数的绝对值之和，所以这个算法对 0-1 

多项式是有效的。 Paterson 和 Stockmeyer 还给出另一个算法，它使用大约个乘 
法)。 

参考文献 :SICOMP 2 (1973),60 〜66;也见 J . E . Savage , SJCOMP 3 (1974),150- 
158 J . Ganz , S/COMP 24 (1995)，473 〜483。关于加法的类似结果，见 Bomdin 和 Cook , 
SICOMP 5 ( 1976 ),146-157 ；Rivest 和 Van de Wiele , Inf . Proc . Letters 8 (1979) ， 178 〜 
180)。 

43 . 当 a z = 屮 + 以是对于? 2 + 1 的某个最优加法链中的一步时， 计算/ 二 sc ^ 
和 A = +岛，其中/>/ = "" 1 +…+ + 1;省去最后对 f L 的计算。每当 a k ~ 1 

时，特别是当2 = 1时，我们节省一次乘法。（参考习题 4.6. 3-31，且 ej 。） 

44. 设 / = Llg 77」， 并假设^'/，…，:^已预先计算好了。如果 W (: r ) 是次数 

n =2 m + 1的首 一 多项式，我们可以写 u ( x ) ~ { x m + Y + a ) v ( x ) + 其中 

z ;( x ) 和 wU ) 是次数为 m 的首一多项式。对于^ =2 / + 1 - 1>3,这产生一个要求 
2 1 - 1次进一步的乘法和 2 Z + 1 +2 Z — 1 - 2 次加法的方法。如果72 =2 Z ，我们可以应用 

霍纳规则对 n 减1。而且如果 m =2 l K n < 2’ 十 1 — 1，我们可以写 u { x ) = x m v ( x ) + 
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其中 I ；和 tt ; 分别是 n - m 次和 m 次的首一多项式。对 Z 用归纳法，在做了 

预计算之后，这至多要求+ / - 1次乘法和^ ■;? 次加法。[参见 S . Winograd,JBM 

Tech . Disclosure Bull . 13 (1970) ， 1133 〜 1135。 ] 

注••在相同的基本规则下，如果我们的目标是来极小化乘法 + 加法，有可能以 

^-n + O ( vG ) 次乘法和72十 0(/^) 次加法来计算以 X )。普通的多项式 




1 ) + 0^)(：^ +2 + # 2 ) + 


a 2 ) … j ( / + ft -;) 十 ^k-jj + ft) 

“覆盖”指数 I _;，_; + 々，).十々十（々- l)，".，j + 々 + ( 焱 - 1) + …+ (j + 1) y m ' - k ， m ’ 

—k + 1 ，…， - jj 的系数，其中 


m ’ — 





对于％ = (U+ 通过把这样的多项式 Pu m] U).p lkni2 (x)^^ 

Pkkm (2) 加在一起，我们得到次数为 ^ + 1 的任意首一多项式。 [Rabin 和 

k 

Winograd,Comm, on Pure and Applied Math. 25 (1972) ， 433 〜 458 ， §2 ; 这一论文还 
证明，如果 rz 足够大，对于所有 6 〉 0, 则带有 + 72 十 0 (log n) 次乘法和小于等于 （ 1 十 


n 次加法的构造是可能的 


o 


45•证明 （7^) 的秩至多是的秩就行了，因为通过对变换 F 


一 1 


的相同方式来变换它，我们可以从 （ T &) 重新得到( 
立即得出 


ijk 


o 


如果 


ijk 


=E 


I 


1 a " 心，则 


T >jk = 2 1</<r ( = = ! = 

[ H . F.de Groote 已经证明，用 7 个链乘法产生 2 X 2 矩阵乘积的所有正规方案 
都是等价的。等价的含义是 ：如同 本题中那样，通过非奇异矩阵乘法它们可以相互 

转化。在这 一 意义下， Strassen 的算法是惟 一 ^的 。参见 Theor, Comp. Sci. 7 (1978)， 
127〜148。] 


46 .由习题45,我们可以增加行、列或平面的任何倍数到另一个行、列或平面上 
而不改变秩；我们也可以用一个非0常数，乘一行 ，一 列或一个平面，或者转置张量。 
总可以找到一系列这样的运算，以把一个给定的 2 X2X2 张量归结成形式 



0 



由定理 W (参见（74))，根据多项式7 



-ru ~ q 在所关心的域中有一个还是两 


个不可约因子，最后的张量有秩3或2。 


47 • —般的 w X 72 X 张量有 mns 个自由度。由习题28知，不可能只用实现 


瘺 


6QS 




习题答案 


(4，^6,0的（/^ + 72 + 5)〃 个元素来表达所有的 m X X S 张量，除非 （77 Z + 7 Z + s)r 
> mm 0 另一方面，假设一个 m X n 矩阵的秩至多为 n ,所以通过分别 
地实现每个矩阵平面，我们可以用个链乘法实现任何张量。[习题46表明，对于 
极大的张量秩，这一下限不是最好的，上限也不是最好的 。 Thomas D . Howell ( Ph . 
D . thesis ， Cornell Univ . ,1976)， 已经证明，在复数上有秩>「 nmsl ( m 十 rz + ； s _ 2 )l 的 

张量。] 

48. 如果 （ A ， B ， C) 和 （ A ' B ' CT ) 是长度分别为 r 和，的 （ ) 和 ） 的实现， 
则 A // = A©A / ,B // =B®B / ,C // = C ㊉ r 和 A"，=C ㊈ 
C ', 是长度分别为 r + /和 r • /的实现。 

注： 许多人很自然地猜想 rank ((“） ㊉ （ d #)) = rank ( t ljk ) + rankU 、）， 但习题 

60 b ) 和习题65的构造使得这个猜想比以前更不可信。 

49 . 由引理 T , rank ( t ijk ) > rank ( Q 反之如果 M 是秩为 r 的一个矩阵，我 

们可以通过行和列的操作来变换它，即求非奇异矩阵 F 和 G , 使得 FMG 除了 r 个 
对角线元素为1外所有元素全为0;参见算法 4.6.2 N 。 因此 FMG 的张量秩<「；而 
且由习题45它和 M 的张量秩相同。 

50. 设 2 =〈二0，其中 和 则 而且显然 

rank ( 二 mn ，因为 （) 是一个排列矩阵。由引理 L , rank ( 纟说 ）> mn 。反之， 

由于仅有 mn 个非0元素，它的秩显然小于等于 mn 0 (因此没有要求少于 m/z 

个明显乘法数的规范方案。也没有这种非规范方案 [ Comm . Pure and AppJ , Math . 3 
(1970)， 165 〜 179]。 但如果使用相同的矩阵并且有 5>1 个不同的列向量，则可实 
现一些节省，因为这等价于 （m X n ) 乘 U X s ) 矩阵乘法。） 


51 . ( a ) 5 ! = 3^0 + 1^2 = ^0 ~ ^1 i m l = y (^0 + ^2 = y ( ^0 _ ^1 ) 5 2 ； ^0 


= 7?2 l 十 7722 , W \ — m I - 77120 ( b ) 这里是一些中间步骤，使用正文中的方法 

x 2 ) + (xy - x 2 ) u)((yQ - y 2 ) + (^i - y2 ) “ ) mod ( u 2 + u 十 1) = (( x 0 - x 2 ) (yo ~ yi ) 

- ( 工 1 - x 2 )(：yi _ ： y 2 )) + (( 工 0 一 X2)(：yo _ 夕 2) —( 工 l _ 工 0)( 夕 1 — ： Vo)) 以。头一个实 



第二个实现是 




得到的算法计算 ^! = 3^0 " h 3^1 ^2 = ^0 _ ^3 = ^2 _ ^0^4 = ^2 _ ^1 ^5 = ^1 + 3^2 ； 



( JC 0 十 ： Ti + : C 2)$5, m 2 = 



(: To + 工 1 一 2x 2 ) S 2 y rri 3 = 






(xq - 2： Ti 十： C 2 ) $3 ， w 4 
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- 2x 0 + Xi + j: 2 ) s 4 ; = m { + m 2 , ^2 ~ 


m i - m 2 y ^ 3 — rriy + m 3 , xvq — t \ ~ , 


VJx = ^3 + 7714 ， W2 ~ t2~ m 4 。 

52 .设当 A mod n '= 〆和 A mod n 〃 二 々〃时々 = 〈々 ’ ， 々" 〉。于是我们希望计算对于 

z’/ 十 modulo 72 ) 和〆’ + j" 三 々’ (modulo w") 求和的加〈々、々"〉= 2 , r ) y { j ',/) o 

通过把，算法应用于长度为，的2,个向量X,"和 Y," ，得到 ，个向 量研^，即可完 

成计算。每个向量加法变成 72 〃 个加法，每个参数乘法变成/个参数乘法，而且向量 
的每个链乘法被次数为/2"的循环卷积代替。[由于习题 4.6.2-32 和定理 W， 如果 
子算法使用在有理数上极小次数的链乘法数，则这个算法比这极小的乘法数多使用 
2( n ~ d ( n / ))( n / ~ din ')) 次乘法，其中 d ( rz) 是”的因子数。] 

53. a) 设对于0<々<^，72(/0 = (/?-1)/4 _1 = 9(，— ^ ! )，而且对6>6有 n ( k ) = l 0 
把数 U， …，7771表示成形式 <2^ (modulo m ) ，其中和< n (^ ) , a 是模〆下 
的一个固定的本原元。例如，当肌= 9时，我们可以令。=2 ; 值是|2 () 3 () ，2 1 3 (3 ,2 () 3 1 ，2 2 3 () , 

2 5 3 0 ,2 1 3 1 ,2 4 3 0 ,2 3 3 0 ,2°3 2 ) o 于是 /UV ) =(…，“々(# ) ，其 中心， 

j f kJ )^ a l + J p k + l o 

对于 0<i<nU ) 和对于每个々和 Z， 我们将计算 f tkl = Z 0<J<nU ) ⑴出山 k ’ 1 、. 


F ( a } p l ) o 这是对于值： c , = oj q P 和乂 = So<j 〈”⑴ [ s 十）三0( modulo n(k + Z ))] 
F ( V〆 ） 的 n(k + l ) 次循环卷积，因为/似是对 r 十 s ^ i ( modulo n(k + / )) 的求和 

2: ra 。 傅里叶变换通过对适当的求和得到。 [注： 例如，当像在 （69) 中那样构 

造诸1的线性组合时，如果已经使用规则 （59) 构造循环卷积算法且 w ” u) -1 = 
{ u ^ k ) i 2 -\)( u nWn + 1)，则结果将纯粹是实的或纯粹是虚的。原因是约简模 
(^ (》)/2 -1)产生带有实系数0^十0；-;的一个多项式，而约简模（/ ( ^ /2 + 1)产生带 
有虚系数 d 〜的一个多项式。] 

当/? = 2时，可应用一个类似的构造，使用表示（- l ) ? a 7 2 / (modulo m ) ，其中 
且 ( Xi < min(e - 々， 1) 且 (Xj _2 。在这种情况下我们以/2 /= 2和？2〃 

— 2 使用习题52的 构造； 尽管这些数不是互素的，但这个构造确实产生循环卷 


积所求的直接积。 

b) 设 + a"m 〃 = 1 ; 并设 a/ = cu a " m " ，⑴ "= a/ 2 w 。 定义 / = s mod m' ， s 〃 = 
s mod m' y t ~ t mod m’ ， t " 二 t mod m ，使得 a/’ = ( a/) “（ a/) “。由此得出 


/(/，/) 



换句话说，对 m 


个元素的一维傅 


里叶变换实际上是对7^ X m " 个元素的二维傅里叶变换的一种改头换面。 

我们将讨论一些“规范”算法，它们的组成方式是：（0诸 F 和诸5的一些和5,; 


( H ) —些乘积 m ,, 它们中每一个都是通过用一个实数或虚数 a , 乘诸 F 或诸 S 之一 
得 到的； （ Hi ) —些和 G ， 它们中的每一个由诸 m 或诸 〆 不是诸 F 或者 s ) 构成。最后 


的值必是诸 w 或诸 L 例如从 (69) 和 a ) 的方法构造的“规范”的 m =5 傅里叶变换 
方案如下 ： h = F ( l ) + F (4) , 5 2 = F (3) + F (2) , s 3 = s x + s 2 yS 4 = s x ~ s 2 、 s s 二 F ( l ) 


题答案 



— F(4) , s 6 = F(2) - F(3), s 7 = s s ~ s 6 ; 


m i = 


~ ( Ct> + CO 2 + O) 4 + CO 5 ) J 7712 = ⑴ 




CO 



O ) 


OJ 


) 54 , 


m 


旁 (.⑺ + a) 2 — a) 4 — co^) y ?n4 = ( — co + co 2 + cd 4 - co 5 ) y 


-^-{co 1 - ct) 2 )5 7 ,m 6 = 1 • F(5) , m 1 = 1 * 53 ； = m \ + 饥 6 ， h = (0 + rn 1 ， 1 2 二 m 3 十 


1H ^ ^ ^0 一 771 2 y 1 4 = 7 ) 1 4 一 ??2 5 , ^ 5 = t \ + [ 2 ，广 6 = 广 3 十乙 4 ，义 7 = 广 1 _ 广 2，<8 = 广 3 _ ^4 j tg 

二 m 6 + m 7 o 注意在 m 6 和中有乘以 1 的 乘法； 这是为我们的约定所要求的，而 

且包括这样一些情况以便用于递归构造中是重要的（尽管这些乘法不必真正去做）。 
这里 ra ^ — /ooi , m 1 — / 010 “5 = /ooo + /ooi = /(2°), t 6 ~ f m ^ /ioi 二/ (2 1 )，等等。我 

们可以通过引人 h = 5 3 +厂(5)改进此方案，并用 （ + ( o > + a ; 2 + a / + w 3 ) _ l )« s 3 [这 

是 -|^ 3 ] 代替，用 lw 8 代替 m 6 , 并删去和 Z 9; 这就节省了乘以1的平凡乘 
法之一，而且当这一方案用来构造更大的傅里叶变换时它将是有利的。在改进的方 

案中，/(5) = m 6 ，/( l ) = z 5 ，/(2) = q ，/(3) = g ，/(4) = 乙7。 

现在假设我们有和 m " 的一维规范方案，并分别使用 （，， a ") 个复数加法， 
(^，0个乘以±1或±丨的平凡乘法，总共有“ / ，彡)个复数乘法（包括平凡的乘法在 
内）。（那些非平凡的乘法也全都是“简单的”，因为它们只含两个实数乘法而无实数 
加法。）通过把的方案应用到长度为的向量 F (^，* )上，我们可以构造适用于 
二维 X m " 情况的一个规范方案。 每个& 步变成 m " 个 加法； 每个 m , 变成 爪〃 个 

元素上的一个傅里叶变换，但这算法中所有 a 都乘以~;而且每个“变成 m 〃个加 

法。于是一个新的算法有 、 a ’ m " + c ' a ") 个复数加法， z ?" 个平凡乘法，及总共 cV " 个 
复数乘法。 

利用这些技术， Wmogmd 已经求出对于下列小的 m 值和下列代价 （ a ，〖， c ) 的 
一 维规范方案： 

m - 2 (2,2,2) m — 1 (36,1,9) 

m = 3 (6,1,3) m = 8 (26,6,8) 

vi — 4 (8,4,4) m = 9 (46,1,12) 

m = 5 (17,1,6) m = 16 (74,8,18) 

通过像上边所介绍的那样把这些方案结合起来，我们就得到使用算术运算数比习题 
14中讨论的“快速傅里叶变换” （ FFT ) 使用的算术运算数还要少的一些方法。例如， 
当 m = 1008 = 7.9.16 时，代价是 （17946 ，8,1944)，所以我们可以用3872个实数乘 
法和35892个实数加法对1008个复数进行傅里叶变换。如 Nussbaumer 和 Quan - 
dalle 在 IBMJ . 尺 es . andDevel . 22 (1978) ，134〜144中所说明的，有可能通过使用多 
维卷积来组合互素的模，从而改进 Winograd 的 方法； 他们的巧妙方法把1008点的 
复数傅里叶变换所需计算数量减少到3084个实数乘法和34668个实数加法。与此 
相对照，1024个复数的 FF 丁要用14344个实数乘和27652个实数加法。但是如果 
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使用习题14答案中两遍扫描合一的改进，则1024个复数的 FFT 只须10936个实数 
乘法和25948个加法，而这不难于实现。因此更精巧的方法仅仅在乘法花的时间大 
大超过加法的机器上才是更快的。 

[参考文献： Rroc . Naf . Acad . Sci . L/SA 73 (1976)，1005 〜 1006 Comp . 32 

(1978), 175 ~199； Advances in Math . 32 (1979 ) ， 83 〜 117; Trans . ASSP -27 

(1979),169 〜 181。] 

54. max (2^ 1 deg ( p r ) _ 1， … ，2 〜 deg ( - 1 ， g + 1)。 

55.2/- 〆 ， 其中^是尸的极小多项式的次数（即使得 p ( P ) 为0矩阵的最小 
次数的首一多项式而(/是它所有的不同不可约因子的个数。（用相似变换约简 

Po) 

56. 设对于所有的 I , J yk , t ijk + t Jlk = T ljk + T Jlk o 如果 （ A ， B ， C ) 是秩为 r 的 
(^)的一个实现，则对所有 k , E/= 1 ( S , a u x t ) ( E jbjiXj ) = = S 2 fj r^ - 

工 / 工 j o 反之，设对于 一 个多项式链的第/个链乘法是乘积 （ a / + 2 jOcnXi ) 
( ft + 其中~和 ft 表示可能的常数项和（或）非线性项。出现于这个链的 

任何步上的所有二次项都可表达为一个线性组合2/^ c z ( S 凡 : A r z )(2/^：^) ;因此这 
个链定义秩< r 的张量 （) 使得& + ^ = + r # 。提示即由此而来。现在 rank 

( T ,jk + ^jik ) = rank (〜 ■々 + ^)< rank (^^) + rank ( Z — ) = 2 rank ( t l}k ) 0 

•^1， …， l W ，： V ： l ，•••，％ 的一个双线性形式是 771 + 72 个变量的一个二次形式，其中 

对于 和7>772,有 r 说 =k — 否则 T ijk = 0 o 现在 rank ( r 说）+ rank ( 9 )> 

rank (^) ，因为我们通过在 （ r # + r # ) 的一个实现 （ A ， B ， C ) 中去掉 A 的最后 rz 行 
和 B 的头 m 行得到的一个实现。 

57 ■设 N 是超过 2/ z 的2的最小次幕，并设 w „ + 1 =…= u N - x - % + 1 =…=_ 
^-! = 0 o 如果 17; = SfL — 0 1 〆 〜和 V. y = Sfto 1 o / q ，0< 5 < iV ， ⑴= e 2WN ，则 

其中后一个求和是对于使得 0< t 卜 t 2 < N 山+ t 2 =t 

(modulo N ) 的所有 q 和进行的。除了 t ^ n 和〖 2 <72使得 q + t 2 < N 以外，其 

余项皆为0;于是这个和是在乘积 w ( z ) t ；( z ) 中^的系数。如果使用习题14的方 
法来计算傅里叶变换和逆变换，则复运算的次数是 0 (N log N ) + 0 (N log N ) + 0 
( N ) + 0 (N log JV ); 且 N < An 。 [参考 4 • 3. 3 C 小节和 J . M . Pollard 的文章，见 

Math . Comp . 25 (1971) ,365~374 0 ] 

当整系数多项式相乘时，有可能使用一个整数〜它的 阶是/ 模素数并且模 
充分多个素数来确定这些结果。在这方面有用的素数连同它们的最小原根 r (当 p 

mod 2^ = 1时我们取 a ； = r ( ^ 1)/2f mod />) 可以像在 4. 5 . 4小节中所介绍的那样求 
出。对于 <=9，小于2 35 的10个最大的情况是0 = 2 35 - 512^1 + 1，其中（^，/0 = (28, 
7),(31,10),(34,13),(56,3),(58,10),(76,5),(80,3),(85,11),(91,5),(101,3)； 

小于 2 31 的10个最大的情况是 p =2 31 - 512 a 十1，其中 U ， 厂）= (1，10)，（11，3)， 

( 19, 11), (20,3), (29,3), (35,3), (55,19), (65,6), (95,3), (121,10) o 对于更大的 
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习题答案 


G 形如2~ + 1的所有素数 M 其中（?<32是奇数，且 2 24 <p< 2 36 ) 由 - l ， r ) 


(11-2 21 ? 3),(25-2 20 ,3),(27-2 20 ,5),(25-2 22 ,3),(27^ 22 ? 7),(5-2 25 ,3),(7*2 26 ,3), 
(27.2 26 ，13)，（15.2 27 ,31)，（17-2 27 ,3),(3.2 30 ,5)，（13.2 28 ,3)，（29.2 27 ,3)，（23.2 29 ,5)给 

出。对于适当小的 e ， 当 aj = 2 e 时，可以使用后边的一些素数。关于这样素数的讨 
论，见 R . M . Robinson , Proc . Awer . Math . Soc . 9 (1958 )，673 〜 681 ； S . W . Golomb , 


Math . Comp . 30 (1976)，657 〜663。在习题 4.6-5 的答案中还引用了另外的全整数 
的方法。 


但是习题 59 的方法在实践中几乎总是更可取的。 

58.(3) — 般来说如果（义，5,0实现（^)，则（（々，‘“，：^)4』，0是其7行々 

列元素为 2 # 说的 IX ” x 5 矩阵的实现。所以（:^，…，中的非 0 元素个数必 

定至少和这个矩阵的秩相同。在对应于 m -1 次乘 n -1 次的多项式乘法的 m 乂 n 
X (77? + 72 - 1 ) 张量情况下，每当（:^，…， ) 7 ^( 0 , …， 0 ) 时，对应的矩阵有秩 n 。 对 


于 A — B 和 m — n ，一 个类似的命题成立。 

注： 特别是，如果我们在2个元素的域上工作，这表明每当 （ A ， B ， C ) 是完全由 
整数组成的一个实现时， A 模2的行构成至少有距离72的 m 个向量的一个“线性 

码”。这一发现源于 R . W . Brockett 和 D . Dobkin[Linear Algebra and its Applications 


(1978)，207 〜 235 ，定理 14; 也参见 Lempel 和 Winograd , IEEE Trans . IT-23 


503 〜 508; Lempel , Seroussi 和 Winograd ， Theoretical Comp . Sci 


(1983) 


285 〜 296]， 它可以用来得到关于整数上的秩的一些非平凡的下限。例如， M . R . 
Brown 和 D.Dobkin [IEEE Trans . C-29 (1980) ， 337 〜 340] 已经用它证明了 在整数 

上 nXn 多项式乘法的实现，对所有充分大的„必定有大于 等于〜 的秩，当 a 是小 

于 


a min = 3.52762 68026 32407 48061 54754 08128 07512 70182 + 

的任何实 数时； 这里 a mn = l / H ( S m 2 ^ COS 2 60 j * H ( p y q ) = p [ g ( llp)^q lg ( l / g ) 是 

二进摘函数， 0&1.34686 是 sin 2 (沒 — k /4) =/ f ( sin 2 0， cos 2 (9) 的根。 M . Kaminski \ J . Algo ¬ 
rithms 9 (1988),137 〜 147] 已经构造了基于割圆多项式，秩为 0 (n log 72 ) 的一个全整 
数实现。 


⑹ 


1 0 0 0 0 1 1 1 
0 10 0 110 1 
0 0 1 1 0 0 1 1 


10000111 、 

01000101 

00100011 

0 0 1 1 0 0 L 


1 0 0 0 0 0 0 0、 

I 1 0 0 0 1 0 0 

I 1 I 0 0 0 1 0 

1 0 0 1 1 I 1 1 

0 0 1 0 1 0 0 0 

.0 0 0 1 0 0 0 0 , 


H‘Cohen 和 A • K . Lenstra [参见 Math . Co 】 邱 ■ 48 (1987) ， S 1 〜 S 2] 已经给出实现 
次数为2,3和4的一般多项式乘法的以下经济的 方式： 
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在每种情况下， A 和 B 矩阵是相等的。 

59. [IEEE Trans. ASSP-28 (1980)，205 〜 215。] 注意循环卷积是多项式乘法模 
/- I ，而负循环卷积是多项式乘法模 u n + l Q 现在我们改变记号，用代替72;我 

们将考虑 （ X G ，…: c 2 « _ i ) 同（: yo ，…， 3 V - 1 ) 的循环和负循环卷积 （ ^0，…， 2 y 1 _ 1 ) 的递 

归算法。为了简略和易于剖析起见，这些算法以非最优的形式 给出； 实现这些算法 
的读者将会注意到，许多事情可以流水线化。例如，在步骤 N 5 中的的值 

将总是零。 

C1 • [测试简单情况]如果72 = 1 ,则置 z 0 ^j：Qyo + x x yi , ^2^( x0 + ^\)(yo + 

: yi ) _ 2。，并终止。否则置肌 —2” — 、 

C2. [剩余化]对于（X々< m ， 置 （ & ，工讲+々 ） — （ :^ + 工 m + k ，工 k — x m + k 、，及 

(yk yy m + k)^~(yk + y m + k yyk ~ y m + k)o (现在我们有 x (w ) mod ( u m - 1) = 

工 0 + … + 工饥 - 1 和工（以 ） moc [( + 1) = + … + X 2 m -\ U m ~ l ; 我们将 

计算 x(u) y(u) mod (u m - 1) 和 x ( u) y ( u) mod ( w m 十 1)， 然后将通过 


fl 0 0 0 1 1 0 0 1 
0 1 0 0 1 0 0 1 1 
0 0 1 0 0 1 1 0 


L 0 0 0 1 0 0 1 1 



，相同， 
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题答案 

(59) 把这些结果结合起来。） 

C 3 .[递归]置 （ zo ，】 ) 成为（: ro ，…，、_〖 ） 同（: yo ，…， ： y w - : ) 的循环卷 
积。并置（、，…， 2： 27 n - i ) 成为，…， x 2 m -\) 同（: y w ，…，: y 2 m - 1 ) 的负循环 
卷积。 

I 

C 4. [非剩余化]对于0<々 < m ，置 （ q ，、+ 々 ）—y q + z m + k , z k - z m + k ) 0 

现在 U Q ， …，^是所求答案。 ■ 


Nl . [测试简单情况]如果 w = 1 ， 则置 t ^~ x 0 ( y 0 + : yi ) ， 〖 -( jc 0 + x x ) y x , 

q —i + Ui - x 。） 火)，并终止。否则置 m —2 LW 2 」 及 r — 2「” /21 。（下列步骤 
使用 2” + 1 个辅助变量 X^(0<z<2m,0<; < r) 来表示 2m 个多项式 

—^类似地，有2” + 1 个辅助变量 y ^ o ) 


N 2. [辅助多项式初始化] 


置 X LJ 


X ( 


+ m)j 


X 


爪 J 


Y ： 


Y 


(z + m)j 


ymj + i 


，其 


中 0< Z < m 和 0< j < r o (这时我们有工“） = X 0 U W ) + wK ，）+ …十 


而且对于: yU ) —个类似的公式成立。我们的策略将是按 


如下方式把这些多项式在模 “ mr 十 1) = 十 1) 之下相乘：对多项式 

X(w) 和 y(w) 做模 （ U/ + 1) 的运算，找出它们的长度为 2m 的循环卷积并 

由此得到: rU )), U ) 三 Z 0 U m ) + “&(，）+…十 “ 2m — 丄厶饥— iU m )。） 

N3 .[ 变换 ]( 现在要做的实质上是对多项式 （ X G ， … ， X 7n — ! ， () ， … ， 0) 和 OV …， 

Y ^ dO , …， 0) 做一个快速傅里叶变换，并用作为二 2 m 次单位 

根。这是有效的，因为乘以 w 的幂实际上不能算是 一 个乘法。）对于 j = 
Ln/2 」 _1 ， … ， 1 ， 0( 按此顺序），对所有 m 个二进数 s + t = ( 、， 2 」 … 〜 + 1 0 … 0 )2 

+ (0… 0~ —i … 〜） 2 做下列操作：用多项式偶 （ X 5 + , ( w ) + w (rlm)s， 

X s+ t + 2 J i ' w ) y X s+ t ( w ) - W( rlm 、 S X s + t + 2 j ( ^ )) 代替 （ X s+ t ( CO ), 

X 5 + , + 2 如 ））， 其中 / = 2"w"s Ln/2 」) 2o ( 我们正以 K = 2m 和⑴=加心 

计算 4.3.3-(39); 注意 / 中二进位的反序。更确切地说，操作 X i (w)^X 1 

(w) + WX〆w) 意味着，对于 k^j < r ，我们置 X {j ^X tj + X/( 厂 *) ，而且对 
于 Q<j<k — 厂 X l(j - k + r)0 可以做 兄（加） 的一个副本而无须浪费 

许多空间。 ) 对诸 Y 做同样的变换。 

N4. [ 递归 ] 对 0^i<2m ，置 (Z t0 ， … ， >Z“ r -!)) 成为（足。， … ， —") 和 （ Y i0 ， …， 

Yam)) 的负循环卷积。 ' 

N5.[ 变、换 ] 对于 7 =0 ， 1 ， … ， Ln/2 」 （按此顺序），对于如步骤 N3 中那样的 s 

和 Z 的所有 m 种选择，置 （ Z 5 + ,(uO, 乙 + , + 2)(7^)) — + 十 


Z s + t + 2 ^ zv ), w - ( rlmh \ Z , + t ( vu )- Z s + l + 1 K^)))o 

N 6.[ fi 装](现在我们已经实现了在步骤 N 2 结束时指出的目标，因为容易看 
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岀，诸 Z 的变换是诸 X 和诸 Y 变换的乘积。）对0< j < r ，0« m ， 置 z 广 

Z(w + i)(r — 1) 和 之 mj + i ^ij ^ (m + i)(j ~ I ) 0 ■ 


容易验证，对于这个计算中的中间变量至多需要〃位附加的 精度； 即如果在算 
法开始时对于 0< z <2”， | %.|< M ，则 所有工 和 X 变量将全都以 2 n M 为界。所有 

的 z 和 Z 变量全部以 （2 W A 0 2 为界，它们比最后的卷积拥有的二进位数多出72位。 

算法 N 执行 A „ 个加减法，个折半，及 M „ 个乘法，其中 Ai = 5，！^ =0，]^ 

= 3;对于72 >1，我们有 A , = L 7 z /2 J 2 W + 2 + 2 LW2J + 1 A r7z/2l + ( lnl 2 j + 1)2^ + 1 + 2 \ D n 

= 2 LW2j + 1 D rW2l + ( Ln /2 J + 1)2” + 1 ，及 M „ = 2 LW2 」 + 1 M 「 W21 。这些解是 A n = 11- 


n - 1 + Tlgnl 



-3-2 n +6-2 n S n ,D, =4-2"" 1 + rig,71 


- 2 - 2 " 



一 1 + 「 lg^l 



这里 S „ 满足递推式5 1 =0，\=25「„ /21 +卜/2」，而且不难证明对于所有 n > l 不等 


式 ^ ■T2 「 lg72~|<S„<S 72 + 1 <^~rz lg n + n o 算法 C 和算法 N 差不多做同样数量的工 

作。 

60. a) 例如，在2 ^ 中，我们可以把所有有公共的 J 和々 值的项组成一个三线性 

项； 当 E 时，这给出 〆 个三线性项，当 G j)G£：x O 时加上 / 项，且当 
G ，々） GOx£ ： 时再加 ^ 项。 当 ] =k 时，我们也可以不花代价地在 2 i 中包括-巧 

[ 在 72 = 10 的情况下，这个方法用 710 个非可交换的乘法乘 10X10 矩阵，这 

和在习题 12 的答案中引用的 Makarov 的方法等于 7 个 5 X 5 矩阵乘法几乎同样好， 
尽管当允许交换时 Winograd 的方案 （ 35 ) 仅使用 600 次乘法。通过一个类似的方 
案， Pan 头一次证明，对于所有很大的 〃， Af(7z)<7z 2 ' 因而这唤起了对于这个问题 
的强烈兴趣。参见 SJCOMP 9 (1980),321 〜 342。] 

b) 这里我们简单地令 S 是一个问题的所有下标是另一个问题的下 
标。 [ 当 m = 72 = s = 10 时，结果是十分令人惊讶的：我们可以用 1300 个非可交换乘 
法来乘两个分开的 10 X10 矩阵，然而却还不知道有用 650 个乘法来乘它们每一个 
的算法 。] 

61. a) 用 w ) 代替 a u (u)o b) 在长度为 r = rank rf ( ^ ) 的一个多项式实现 

中命 a u (u) = Tj M a il/u u M , 等等。于是 ^ = 2# + v + a ^ d 2/ r ^ 1 [这一结果在 

无限域中可改进成为 rank( t ijk )^(2d + l)rank^( t ljk ) ，因为 Bini 和 Pan 指出，三线性 

形式 + y + 对应于多项式 modulo / + 1 的乘法。 参见 Calcolo 17 (1980),87 〜 

97 0 ]c),d) 由习题 48 中的一些实现看，这是显然的。 

e) 假设我们有 Z 和 r ， 的实现，使得 h a u b jlCkl - t ijk u d + O (/ + 1 ) 和 

^L^\^{ii')L^{jj ， )Lp{kk ， )L — \-i — j — + 0 (/”） 。于是 

R r r r 

ss ^il^- (li) L ( mj ) L 〉: ^kn^{nk)L ~~ ^ijkP i jk ^ + 0( W ) 

L = 1 / = 1 m — 1 n = 1 

62 . 对于 U ， 使用定理 W 的证明方法可得秩为 3 。边界秩不能是 1 ，因 
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为我们不能有 ai ( u ) bi ( u ) Ci ( u ) = ai ( u ) b 2( u ) C 2( u ) = u d 和 aj ( w ) 62 ( w ) c ! ( w ) 


ai(u) b i(u) 02 ( u) = 0 (modulo u 




) o 由于实现 


u 



-1 


u 0 / 


， lo 


u 


故边界秩为 2 。 

边界秩的概念是由 Bini ， Capovani ， Lotti 和 Romani 在 Jnformat / o/a Processing 

Letters 8 (1979) ,234 〜 235 中引进的。 

63. a ) 设 T ( m ， n ， s ) 和了 （ M ， N ， S ) 的元素分别用 仏， 和 


了</ r 〉 标记。直接积的每个 兀素口 




(其中4 


i ， I ") ， 9 




G ，/> 和又 

=/7 和 = 


=〈々， iO ) 由定义等于 ~,,/>< y 〉 u，,'〉 x T ( j ， nm K ， no 所以它是 [J 

夕和 T = 又]。 


b ) 以 M ( N ) 




rankn ( T(N ， N ， N)) 应 用习题 61 e ) 


c ) 我们有 ( mnsX r 3 ，因为 T ( mns , mns ， mns ) — T(m ， n ， s ) ③ T(n ， s ， 

m)®T(s ， m ， n )。 如果 M ( n )< R ，对于所有 / z , 我们有 M ( / )<以，而且由此得 
出 M ( N )< jVTU 「 1 ° g ” Nl < J R 「 l ° g ” Nl < iW bgi?/l ° g ' [这一结果出现于 Pan 1972年的文 

章。] 


d ) 对于某个 d 我们有 M , 


mns 


)< 



，其中 M d (n) 




rank ^ (丁 （ n ， n ， n )) 0 如 


果 M “ n )< 尺，则对所有 A 我们有 M 


hd 


n / z )< i ^， 而且因为由习题 61 b ), M (^)< 


hd + 2 
2 


#，所以得出所述公式。在无限域中，我们节省了 log N 的一个因子。[这 


结果是由 Bim 和 Sch 6 nhage 于1979年给出的。] 


64 •当 fk ( u ) 




(x 


k \ 



u 





u 2 yn)z kk + (: c H 十 u 2 x k3 )y 3k ((l-^ u)z kk - 


以 （Al + ^2 + 之々 3)) — ^k\(y2k + 加）（ 



z k 2 



免 ） 和 gjk(u) 


( 工 H 



u 


^j2 ) ( 3 ^ 


2 k 


uyij ) ( z kj 


U 


^ jk ) 



^ i 



^ 2 ^j3)(y2k 



wu )4 时,我们有 T^ k (f k (u) + Tj^kgj^iu)) 


_ U S 1^: , A ^3 ^ ijyjk^ki + Oiu 3 )o [对于 rank (： T (3,3,3)) 已知的最好上限是 23; 参 
见习题 12 的答案。 T ( 2 , 2 , 2 ) 的边界秩仍未知。] 


65.提示中的多项式是 u 2 m 


S ； =1 ( x ^ + x 7； y , z ) + o “ 3 )。 对于 i <;< 


m 和 l < j < n 令毛和 Y , 是不确 定的； 还置 X z „ 


y 


mj 


0 ,X 


mj 




m 一 1 




-2 D " 


于是，对于不确定量中的 



1 个多项式乘法，对于每个 i 和 J 我们 


可以计算 X ”以及 


[SICOMP 10 (1981),434 


-1 




455。在这篇经典的论文中， Sch 6 nhage 还推导了习题64,66及67 i ) 的结果。 


66. a ) 设 oj 


lim inf^colog Af (/ z)/log rz ;由引理 T ， 我们有 co ^2 Q 对于所有 


( 


> 0 ,有 


个 N 使 M ( N )< N 


( o 习题 63 c ) 的论证现在表明，对于所有充分大的 


M ( n ) 


b ) 这是习题 63 d ) 的一个直接结果。 


C) 令 r 




rank ( t ) y q 




mns 


/3 


，Q 


p ， 存在一个整常数 q 使得 


( AWS ) W3 。 给定 f >0, 对于所有正整数 

对于每个整数 A >0,我 们有， = 
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㊉ n k N h - k , s k S h ~ k ), 以及给定 /i 和々，令 p = 

I h \ l/( …） 

L , Jo 于是由习题 63b)， 

\k I 

arMT ( Pm k M h -、 Pn k N h - k ， ps k S h - ” ) < rank ( M ( p ) T ( m k M h - k ， n k N h - k ， s k S h ~ k )) < 

rank )丁( n k N h — k ， 伙-々 ）)< 

V \k f / 

h 

c,r 

而且由 b) 得岀 

p ^ q k Q h-k = ( p m ^ M h ~ k pn k N h ~ k ps k S h ~ k ) a,/3 < c/ 

/ u \i/U + 0 

由于 P > [ k ) / 2 ,我们有 

( i \ / L w /( + 0 

k Jq h Q h ~ k < j ( 2 p)VQH < 2 f/l/( — )2'/ 

因此对于所有 hXq + Q) h <(h + l)2 (A/(a; + 0 2^/o 因而由此得出，对于所有6>0, 

g + Q<2" (aj —)r 0 、 

d ) 在习题65中置 m = n=4, 并且注意 10 g ‘ 85 + 9 g _ 85 >17。 

67. a) mn X mns 2 矩阵 （ 仏/>(«〉 〈&，〉）） 有秩饥打，因为对于 k — k ' — \ 当把矩阵 

限制成行时，它是排列矩阵。 

b )(( 〖 ㊉ O zW ) 实质上加上+ s〆 个另外的零的列。 

[类似地对于直接乘积，我们有（（必 o 7:w ) = U. W )®U; W )。] 

c) 令 D 是对角矩阵 diagUi ，…，尤），使得 ADB T = 0。由引理 T 我们知道 

rank( A) = m 和 rank(B ) = ” ；因此 rank( AD ) - m , rank(DjB T ) 二 n 0 不失一般性， 

我们可以假定 A 的头 m 列线性无关。由于 B T 的列是在 AD 的零空间中，因此我 
们也可以假定， B 的最后 n 列线性无关。把 A 写成为分划的形式 
中 Ai 是 m X m (且非奇异） ，A 2 是 mX q 以及 A 3 是 m X 〜 也把 D 分划成使得 
AD = ( A 1 D 1 A 2 D 2 A 3 D 3 )。 于是有一个 g x r 的矩阵 W = (W\J 0) 使得 ADW r - 
0,即 W 1= - Z ^ A ^ ArTDr 类似地，我们可以写而且我们发现 
当 V =(0 JV 3 ) 是 g x r 矩阵且 V 3 = - D 2 BjB 3 ' T D 3 l Bi VDB T = 0。注意 UDV r 

=D 2 ，因此提示被确立（终究，它差不多只是一个提示）。 

现在，对于 l< i<m f A (m + i ) i ( u ) = + £ ,我们令 A u ( u ) 二 a " ;对于 1<_; 

<n , B( n + j ) i ( u ) = vo ]t u , 4* 巧/( w )= 〜;对于 1<^<5 , C (j + 1)/ ( w ) = ^/ ,4* C kL ( u ) 
=w 2 c “。 由此得出，如果，则 S/= 1 A iL ( w w ) Cw ( w ) 等于 u 2 t ijk + 0( w 3 ), 

如果 6 = 5 + 1, 则等于 u 2 [ i > m ][ j > n ] 0 [在这个证明中我们不必假定相对于 C, 
t 是不退化的。] 

d) 对于 r = mn 十1，考虑 7 Xm ，l，n) 的如下实现••如果 Z<mnJ,U a u = [ lHn ] 
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习题答案 


= i ~ 1~\, bji = [ Z mod n ^ j ~\ ，6〈,)•〉/ = [ Z = ( z — \ ) n 十 j = 1 ， = — 1, c ( 7 ^) r = 0 0 

对于 l < Z < r ，对4 = 1，这是可改进的。 

e ) 想法是求出了 （ m ， rz ， s ) 的一个可改进的实现。假设 （ A ， B ， C ) 是长度为 r 
的一个实现。给定任意整数，…，，/? i ，…， ft ，对于，通过定义 

^{ij')(r + p) — a i [j — pit ^ (jk ， )(r+ Jy) — A'O' = P ] > ^ (ki')(r+ p) = 0 

扩充 A ， B 和 C 。 如果对于/<厂，4 = 2/^ 1 2“ 1 七伽〈& >/ ，否则4= -1， 我们有 


r + ;i ms r n 

Sa = 2 2 a ii^k ^ X) 〜 = p]= 

/ = 1 〆 =i 走 = 1 / = 1 p= 1 

Ij ^ - Ij = 

所以如果这是可改进的。但 d r 是 （ a ! ，…， cu ，…， A ) 中的一个 
多项式，不恒等于零，因为不失一般性，我们可以假定 C 没有全零的列。因此对于 


诸 a 和诸^的某个选择就行。 

f ) 如果 M ( 72) = 72' 我们有 M ( W )= 因此 

rank ( T ( n } \ n \ n h ) ㊉ T (1, t 2^ - n h (2 n h - 1),1)) < n huj + n h 

习题 66 c ) 现在意味着对于所有的 h ， n hw + ( n hw - 2 n 2h + n h ) w 13 <： n hui + /。因此 
a = 2; 但是这同下限2，-1相矛盾（参见习题12的答案）。 

g ) 令 /( w ) 和 g(u ) 是使得 V /( w ) 和 Wg ( w ) 的兀素是多项式的多项式。于是 

我们重新定义 

A (i + m)l = u d + l v lL f ( u)l d i + m , B( J + n)l = u d+l zv ^ giu)/p , C ki = u d + e +2 c kl 


其中 f ( u ) g ( u ) = pu e + 0 U e + 1 )。 由此得出，如果 


GU ) 等于 u 


d ^ e ^ 




+ 0 ( 


U 


of + e + 


); 如果々 




s 



1，则等于 U 


d ^ e + 2 


_ z 〉 


m 


'\[j> 


n 


o 


[注 ：因此 如果以 mnk 来代替 rank 2 ，在任何域上， e ) 的结果都成立，因为我们可 


以选择诸 a 和0成为形如1 + OU ) 的多项式。] 

h ) 令 C 的行/>指的是分量丁(1，16，1)。关键之点是对于在删除之后剩下的 f 
和 j ，2/^1<2 2 /( w )~ Z ( w ) c / >/( w ) 为零（而不只是 0( / + 1 ));而且对于所有 L yCpiiu )^ 

0。在 c ) 和 g ) 的构造中，这些性质为真，因此当我们取直接积时，它们也仍保持为 
真。 

0直接从二项式推广到多项式。 

j ) 在 h ) 之后，我们有 8 r /3 + 2(36 W3 ) + 34 W 3 <100, 所以 o ><2.52。 再次平方给 

出! (丁（81，1，81) ㊉ 4丁(27,4,27 )㊉ >2丁（9,34,9) ㊉ 4了（9，16,9) ㊉ 4丁（3，136, 
3)©丁（1，3344，1))<10000;这产生出<2.4999。成功！连续的平方导致快速收敛 
到 2. 497723729083…的越来越好的下限。如果我们以丁（4,1，4) ㊉ 丁 （1 ，9, 1) 开始 
而不是了(3，1，3) ㊉ 丁（1，4，1)开始，则极限的限已是 2. 51096309…。 

[类似的技巧产生 w <2. 496;参见 SJCOMP 11 (1982),472 〜492。] 

68.T.M. Vari 通过证明 tz 次乘法对计算 : rf + …+上 2 „是必须的，而证明 tz _ 1 


次乘法是必须的 [ Cornell Computer Scienece Report 120 (1972)]。 C . Pandu Rangan 
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4.6.4 小节 


证明，如果我们把多项式计算为1^^ +…+ ，其中诸 L 和诸尺是诸: T 的 

线性组合，则为构造诸 L 和诸 R ， 至少需要 72-2 次加法 [J. Aigorif/mis 4 (1983)， 
282〜285]。但他的下限不明显地适用于所有多项式链。 

69.令％二％ - D = j ]， 并且使用在 n 2 个变量乂的幂级数上的算术，但忽略 

掉总次数>71 的所有项，应用递归构造 （31) 到矩阵 J + Y 上。数组的每一元素 A 被 
表示为一个和 /^ c ) + /m + …+ /1„，其中心是次数为々的 一 个齐次多项式的值。于是 

每一个加法步变成 72 +1 次加法，而每一个乘法步变成约等于 + 次乘法和约等于 


■y n 2 次加法。其次，每一个除法是形如1 + / i : +…+ 的一^个量，因为在递归构造 

中当^完全为零时所有除法由1表示；因此除法要稍微比乘法容易些（参见当％ 
二1时的等式 4. 7-(3))。由于在我们达到一个 2 X 2 行列式时就停止了，当 ； >/2 - 2 

时，我们不需要从％减1。结果是，当删去冗余的计算时，这个方法要求 20(^) + 



+ 5 n — 4次乘法和20 





_ w 次力口 


法，于是每一个都是 f n 5 -0 U 4 )。 在许多其它情况下，一个类似的方法可用来消 

除除法，参见 264 (1973),184 〜202。（但下一习题对于行列式构造一个甚至 
更快的无除法方案。） 

70.在提示的恒等式中，置 A = A ~ x , B = - u , C = - = Y ， 利用 J / 

A + Y / A 2 + Y 2 / A 3 + …是 D 的逆这一事实作为 1/ A 中的一个形式幂级数，然后两边 
取行列式。我们仅对 -2 需要计算、，因为我们 知道/ x ( A ) 是 rz 次多 

项式。于是，为从 w_l 次推进到 n 次，只需要 rz 3 + 0(?7 2 ) 次乘法和 n 3 + 0 ( 〃 2 )次 
加法。递归地处理，我们在做了 + + 次乘法和6(^) + 5(^) + 


2匕)次加减法之后从 X 的元素得到 / x 的系数。 

如果我们只要计算 det X = ( - l )7 x (0) ,我们可节省3(^)-72 + 1次乘法和 

次加法。当 rz 有中等大小时，行列式计算的无除法方法事实上十分经济，当 n 
>4时它击败显见的余子式展开方案。 

如果 w 是习题66中的矩阵乘法的指数，同样的方法导致一个在 0( n 〜 + 1 + f ) 步 
内的无除法方法，因为对于0<々< 72,可在 0( M ( n)\og n ) 步内计算向量:对于 

0<々<2/，取其头个行为的一个矩阵，并以 Y 2/ 乘之； 于是对于 

这个乘积的头 2 Z 行是 [参见 S . J . Berkowitz , Znf . Processing Letters 18 (1984), 
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习题答案 


147 〜 150。]当然这样渐近地“快”的矩阵乘法严格地仅是有理论价值。 E.Kaltofen 


已经说明怎样只以 0(77 2+( yiV ^ r )) 次加法，减法和乘法来计算行列式 [ Prac . Jnt . 
Symp . Symb . Alg . Comp . 17 (1992) ， 342 〜 349]; 即使当 M ( w ) = w 3 时他的方法都令 

人感兴趣。 

71 .假设 g \ = yg r ~ W r 。 ，以及 /=〜以 + … + a r< gV + f 0 ，其中 U k = 

Ai 兮 i + … + Pk ( k -\) gk -\ + 九，％ = yk \ g \ + *•* + yk ( k - i ) gk-i + %，每个。是 “ x ”或 
“/”，而每个岛或幻是心，…，中次数<1的一个多项式。对于々= r ， r _ l ， …，1， 

计算辅助变量 

k ， y k ,之 k 如下 : ZV k — a k + P(k + \)kyk + 1 + y (k + \) k Z k + 1 + ..♦ + Prkyr + 

，以及 

yk = zv k x z k = zv k x u k y 如果名） = w X % 

yk 二加 kl 叫， z k = - y k x gky 如果以 = 

则 /'= 〆 ()+ 013 V + A + … + Pbr + <? 〆 ,，其中 表不关 于任何 工1 ，…， A 的导数。 

_ W.Baur 和 V . Strassen , Theoretical Comp . Sci . 22 (1983) ， 317 〜330。 S . Linnainma , 

BIT 16 (1976),146 〜 160 发表了一个相关的方法，用来做舍人误差的分析。]如果 gv 
= u r X Vr 我们节省两个链乘法，因为叫_ = 重复此构造以至多 9 m +3^个链乘 
法和43次除法给出所有二阶偏微分。 

72. 在像复数这样代数封闭的域上有一个计算张量的秩的算法，因为这是 Al ¬ 
fred Tarski 的结果的一 '个 特殊情况 ， A Decision Method for Elementary Algebra and 
Geomefry ，第 2 版 （ Berkeley ， California : Univ . of California Press ，1951); 但除非对于 

很小的张量，否则已知的方法并不使该计算真正可行。在有理数域上，这个问题甚 
至还不知道在有限时间之内是否可解。 

73. 在 N 个变量的这样一个多项式链中，在 Z 个加减法步之后已知的 iV 个线性 
形式的任何 NX N 矩阵的行列式至多是 2 Z 。 而且在离散的傅里叶变换中，最后的 
N = m l - m n 个线性形式的矩阵有行列式 JV N /2 , 因为由习题13,它的平方是 N 乘以 


个排列矩阵 [/ACM 20 (1973),305 




306] 


o 


74. a ) 如果々 = (&，…， t) T 是互素整数的一个向量，则 L % 也是，因为 U ■々的 


元素的任何公因子整除々 


U 


一 1 


Uk 的所有元素。因此 VUk 不能有全部整分量。 


b ) 假设有一个带〖个乘法的 v ： r 的多项式链。如果^=0, V 的元素必是全为 


整数，因此 


S 


0。否则设 




或 a 2 . 



Xh 是头一个乘法步。我们可以假定 



n x Xi 


+ 




+ 71^ s 十 /?， 其中& ，…， 是不全为零的整数，而/?是常数。求 一 个 


单模矩阵 U 使得 （72 


y 


71 


)U 




(0,…， 0， d )， 其中 d = gcd ( n t , , n 5 ) 0 (在等式 


4.5.2-(14) 前边讨论的算法隐含了这样一个 U 的定义。）对于输入力 


3 ^ 5 - 


1构造 


新的多项式链如下：首先计算 ： r = ( ^，…， A ) 


T 


U(y { , 


H ， — 纠 d ) T ，然 


后以假定的 V : r 的多项式链继续。当达到该链的步骤 z 时，我们将有 A 


n 


s 


) 


n , x 



0 = 0,所以我们可以简单地置 A , =0 以代替乘法。在计算了 Vx 之后，把常 


数向量 41 d 加到结果上，其中 w 是 V [/的最右列，并设 W 是 VL 7 的其它 s 


1列。 
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4.7 节 


新的多项式链已经以， - 1次乘法计算 Vx + w [ 3 l d = VU (: yi ，…，: y 5 - i ， _ ^1 d) T + 
zvj^l d — W ^(3； 1 , ,,, ，3； 5 _ 1 ) T o 但由 a ) , W 的列是 Z 无关的；因此，通过对 5 的归纳法， 

因此我们有 t^-S 0 

c ) 设对于不在 Z - 无关列的集合中的 j 的个值，& = 0 。 W 的任何链于是 
计算 b ) 适用的对于矩阵浐的 

d ) X \ = X ~ y > ^2 = ^1 久 1，久3=义2 + ^ ~ ( l /^) ^ = ^4 久4,久6 = 久5 + 

3^( = x + yl 3 )^ X-j = — Aj ,Ag = ^7 入 4(= 工 /2 + ； y )。 但是 i jt /2 + ^)/2| 需要 


两个乘法，因为^| 2 
(1978),125 〜 129。] 


l / j 的列是 Z 无关的。 


[Journal of Information Processing 1 


4.7 节 


1. 如同在 (4) 中那样，求头一个非零系数，并用，除 L 7( z ) 和 VU ) (把系 
数左移 m 位）。商将是一个幂级数当且仅当％ = — = 17^4=0。 

2 -我们有 VS + i W ”= -( (\^恥）（\/[ 2 八— [ 卜… 

-( V ^ W 77 . 1 )( VgVjo 于是，我们可以以 对于』>1, 用 （％ R，％- 1 %) 代替 （ K ， 
V ; ) 开始，然后对于72>0置 W ; I ^ U n ~ SGo 1 W 八- 々，最后对于）>0,用 W } IV ^ 1 
代替 W ,。 类似的一些技术也可用于本节中的其它算法。 

3. 是。当 a =0时，由归纳法容易证明％= W 2 = …=0。当 a = l 时，由漂亮 

的恒等式 

公 ( 卜 ( n — k) )v k v n - k = V„V 0 

k = \ V 71 I 

我们发现 Ho 

4. 如果 W ( z ) = e v(z) W \ z ) = \^(幻 WU ); 我们发现 W 0 = e v 。，且 

l = S -^ k ^ n-k 

^ = 1 fL 

其中 n >\ o 如果 W ( z)^\n V ( Z )， 则 \ /和 W 的作用被 颠倒； 因此当 V 0 = l 时，规 
则是 W 0 = 0 以及对于 /2> H = 八+ — 

[由习题6,在 OU log 72) 次运算之下此算法可达到阶72。 R . P . Brent 发现通 

过把牛顿方法应用于 / U ) 二 In : r - V ( z ) 上，可以以这个渐近速度计算 

exp ( V (之 ）) ; 因此 一 般的乘幂 （1 + V ( z ))° = exp ( aln ( 1 + V ( z ))) 也是 0 (n log n ) 0 
参考 文献： J . F . Traub 编辑 .Analytic Computational Complexity (New York : A cadem - 

ic Press ,1975),172-176 0 ] 

5 . 我们再次回到原来的级数，这可以用来测试一个反演算法。 

6•多 （ x ) = x + x ( l - xVU )) ; 参考算法 4.3.3 JR 。 于是在知道 W G , …， Wn — , 之 
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习题答案 


后，办法是输人 V N ，…， V 2N —i ，计算 （W G + … + W N — D x ( % + … + V 2N . r 

z 2N ~ l ) = 1 + 尺 0 ,十…十 R N - iZ 2N - 1 + 0(，），并设 + …+ W 2N — 一 1 = 

-(W 0 + …+ W N . lZ N ~ l )( R 0 + - + 心_ 1 严 1 )+0(/) 0 [ Numer . Math . 22 

(1974) ,341 〜 348; 实质上这个算法首先是由 M. Sieveking 发表的，见 Computing 10 
(1972)，153〜156。]注意，如果我们使用“快速”多项式乘法（习题 4.6. 4-57)，则 N 
个系数共需时间 0(iV log N) 0 

7■当 n = (m_l)々 + l 时，(=)/”，否则为0。（参考习题2.3.4.4-11。） 

8.G1. 输人 Gi 和 V 1; 置 1，[7 0 —1/V; 输出 

G2 .72 加1。如果 ？2〉]V， 则结束算法；否则输人和 G„ 。 

G3 •对于6 二 0，1，…， 72 - 2( 以此次序）置 - 07, - 2 ! 17, - , V ; + ! ) / V !; ^ 

后置 U n —广 - Y ^ 2 kU n — k V k IVp 

G4 •输出 W„ = — 并返回 G2。 ■ 

(阶为 N 3 的算法的运行时间因此只增加 N 2 的阶。） 

注 ：算法 T 和 N 确定 V [ — 1] (L/U)); 在本题中的算法确定 G( \^ [ _ 1] (幻），它是 
稍微不同的。当然，通过一系列的反演和复合运算的序列所有结果都可得到（习题 
11)，但是对于每种情况都有更直接的算法是有益的。 




14 

14 


了 3 


丁4” 



9 

4 


Ts, 1 

10. 借助式 (9) 构造 — x {\ + a x x + a 2 oc 2 + … ）" a = (1 + c^x + 十…）; 

然后求后边这个级数的逆。（见等式 1.2.11.3-(11) 下边的附注。） 

11. 对于 1<々 <N 置 W 。— L / o , 并置（7 \， Wd —( V ^,0) o 然后对于 n = 1,2, 

…， N ， 如下操作 ：对于 72< j < TV ， 置 W , —+ L 7;; 而后对于 j = N ， N - l， …， n 
+ 1,置乃―7^〗％ +…+凡％_„。 

这里 T “） 表示 V ( zY \ 对于这个问题可构造一个类似于算法 T 的在线幂级 
数算法，但是它将要求大约 N 2 /2 个存储单元。还有一个在线算法，它解本题仅仅需 
要 O ( N ) 个存储 单元： 我们可以假定，如果对所有々用代替 R 和用 R / R 代 

替 W ， 则 V ^ lo 然后我们可以通过算法 L 求 VU ) 的逆，并使用它的输出作为习 

题8的算法的输人，且 G l = U l . G 2 = U 2 等等，这样就可以计算 U ( V [ - l ][ ~ 1] ( z )) 
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4.7 节 


- U 0 o 也参见习题20。 

Brent 和 Kung 已经构造了好几个算法，它们在渐近的意义上更快。例如，我们 
通过习题 4.6.4-42( c ) 的一个轻微变形，可以计算对于： c= V ( z ) 的1/(:0,并进行 

代价为 M ( iV ) 的大约2 #个链乘法及代价为 N 的大约 N 个参数乘法，其中 

M ( iV ) 是为把幂级数相乘到阶 iV 所需要的运算 次数； 因此共需时间 0(# M ( N ) 
+ iV 2 ) = 0( N 2 )。 一个稍微更快的方法可以以恒等式 L 7( ^ o (^) + z m V 1 ( z )) = 

U ( V 0 ( z )) + z m U / ( V 0 ( z )) V l ( z ) + z 2 m U "( V 0 ( z )) V l ( z ) 1 l 2 l + …为基础，一直 

展开到大约 Nlm 项，其中我们选择 m ^ VN/log N ;使用稍微类似于习题4 . 6 .4-43 
中的一个算法可在 0( mN(log N ) 2 ) 个运算内计算头一项 [/(^ U ))。 由于通过 

微分和除以 VVz )， 我们可以在 0 (N log iV ) 次运算下从 [/ U) ( V Q ( z )) 进行到 

[/ “ + 1 )( V 0 U ))， 因此整个的过程花费 0( miV ( i 0 g N ) 2 + ( Nlm ) N log N )= 

0 (N log N ) 3/2 次运算 [/ACM 25 (1978)，581 〜 595] 。 

当多项式有 m 个二进位的整系数时，这个算法大约涉及 N 3n + f 次 N(\g m ) 个 

—进位数的乘法，所以总共的运彳了时间将多于 iV 5 / 2 。 P . Ritzmann [ Theoretical 
Comp. Sci. 44 (1986) ，1〜 16] 已经提出具有渐近运行时间 O ( N 2 + 0的另一个方法。 

模一个小的素数 p 可以更快得多地完成复合运算（参乂习题26)。 

12•多项式除法非常简单，除非 m > n > l 0 在后一种情况下，等式 u ( x ) = 

g (:+ r (: c ) 等价于 17(之）= Q ( z ) V ( z ) + / —” + 1 尺 （之），其中 U ( x ) = 

工 、(工 _1 )， V (: r ) = x ” t ;( x — ! ),(3(: r ) = : c w — \(工一丄），且尺（: 0 = / — V(: r — ” 是 

和 r 的“逆”多项式。 

为了求 dx ) 和 r (: r )， 计算幂级数 U ( z )/ V ( z )= W ( z ) + O ” + 1 ) 的头 m 
_n + l 个 系数; 然后计算幂级数 U ( z ) - V ( z ) W ( z )， 它有 ，i + 1 TU ) 的形式， 
其中了 0) = To + + …。注意，对于所有因此 Q ( z ) = w ( z ) 和 

i ^ U ) = TU ) 满足要求。 

13■以“（幻= /和 uU ) = W 0 + …+ ，- 1 应用习题 4.6. 1-3,所求近似 

式是在此算法运行期间得到的 t ； 3 U )/ r 2 U ) 的值。习题 4.6.1-26 告诉我们，对于 
互素的分子和分母没有进一步的可能性。如果每个是一个整数，则算法 4.6.1 C 
的一个全整数的扩充将有所求的性质。 

注：关于进一步的信息，参见 Claude Brezinski ,History of Continued Fractions and 
P^de Approximants ( Berlin ： Springer , 1991)。 情况 TV = + 1 和 deg (zv^) = 

deg ( xv 2 ) = n 是特别有趣的，因为它等价于所谓的 Toepiitz 系统； 在 Bini 和 Pan 的 

Polynomial and Matrix Computations 1 ( Boston : Birkhauser , 1994 ) §2.5 中，对 

Toepiitz 系统的渐近快速方法做了综述。本题的方法可以推广到形式 W ( z ) = p 
( z ) lq ( z )( modulo ( z ~ z ,)--( z ~ 印））的任意有理内插，其中诸％不需要 不同； 于 

是，我们能确定 WU ) 的值及它在若干点的某些导数。见 Richard P . Brent,Fred G . 
Gustavson 和 David Y . Y . Yun , Algorithms 1 (1980) ,259 〜 295。 
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习题答案 


14•如果 U { z )^ z + [；〆 +…和 V (^) = ^ + \^ + 1 d + 1 +…，则我们求得差 

V(U(z))~U / (z)V (幻是 厂 1 + 厂 R + ; + (仅含 U k ，…， U k + J — U 

% + 1 的多项式 ））； 因此给定 L 7 U )， 则 VU ) 是惟一的，而如果给定 
V ( z)m R ， 则 L / U ) 是惟一的。 

这个解依赖于两个辅助算法，它们的头一个对于 VU ) = V 0 + 十…+ 

八_ 〆 — 1 解方程 V(z ^ z k U(z)) = (1 + z k ~ l W(z)) V(z) ^ z k ~ l S(z) + 

0 (d — 1 + ”）， 其中 L ； U )， WU )， S ( z ) 和 n 是给定的。如果 72 二 1，令 V 0 = - S (0)/ 
W (0); 或者当 S (0)= W (0) = 0 时令 V Q 为任意值。为了从 n 进行到 2 n ， 令 

V(z + z k U(z)) = (1 + z k ~ l W(z))V(z) + z k ~ l S(z) - 

z k ~ l + n R(z) + 0(z k ~ l+2r, ) 

1 十 z k - l W(z)= (z/(z + z k U(z))) n (l + z k ~ l W(z)) + 0(z k ~ l + n ) 

S(z)= (zl(z + z k U(z))) n R(z) + 0(z n ) 

并令 V (z) = 八 + K + iZ + … + 满足 

V(z + z k U(z)) = (1 + z k ~ l W(z))V(z) + z k ~ l S(z) + 0(z k ~ l + n ) 

第二个算法对于 U ( z )= L / 0 + 1 /P + … + R — p ” — 1 解 W ( z ) U ( z ) + zir ( z ) 

= V ( z ) + 0( 〆 ）， 其中 V ( z )， W ( z)*n 是给定的。如果 n = l ， 令 U 0 = V(0)l 
W (0), 或者在 V (0) = W (0)=0 的情况下，令 L / Q 是任意的。 为了从 n 进行到 2 rz ， 

设 W(z)U(z) + zU'iz) = V(z) ~ z n R(z) + OU 2 ”）， 并令 U(z)= U n + •■- + 

1 是方程 u + w ( z ))[>(2：) + d ^ ru ) 二尺 u ) + ou ”） 的解。 

恢复 （ 27) 的记号，可以使用头一个算法解 V(U(z))= U / (z)(zlU(z)) k V(z) 
到任何所希望的精度，且置 V(^) = ^V(^) 0 为了求 PU), 假设我们有 V(P(z)) 
= P / (z)V(z)^ — 1 + ") ，这是当尸 （ z) = z + 和 a 任意时，对 n = 1 成立的 

一个方程。通过设 V(P(z)) = P / (z)V(z) ^ z lk ~ 1 + n R(z) ^ — 1 + 272 ) 和用 

+ / + 代替 PU )， 我们可以从 n 进行到 2 rz ， 其中第二个算法用来求多 

项式户（之），使得（々 ^ n~ zV / (P(z))IV(z))P(z) + zP / (z) = (z k IV(z))R(z)^ 
0(/)0 

15.微分方程 U / (z)IU(z) k = llz k 意味着对于某个常数 c , A + 

Co 所以我们求得 U [n] (z) = zl(l^ cnz l - k ) lKk ^\ 

一个类似的论证对于任意的 V ( z ), 求解 （27): 如果 \ T ( z ) = l / V ( z )， 对于某 
个 C 我们有 W ( u [ n ] ( z ))= wu ) + nc 。 

16•我们要证明， + 1 (U + l ) i ^ + 1 U )/ V ( z )” - nR / k ( t ) IV ( t) n + x )=0 o 

由于 U + 1)冗 + 山）/%广 - ⑴ / VU 广 + 1 =去（&⑴/%)” + 1 )，这成立。 

因此，我们有 n- 1 [t n ~ l ]R\(t)t n IV(t) ri = (n-l)^[t n ~ 2 ]R / 2 (t)t n - l IV(t) n - 1 = 

… d ，： ⑴ #。）= [£此⑴/% = 
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17 .等置 d 


:V 


m 


的系数，卷积公式指出 



m 


m 


V n { l ^ m ) 


E 


n 



， 它和 


U”]v(z) 卜⑺ = 2 々（ [d] vu)W 


— k 


] vur ) 相同，是 （ 2 ) 的一个特殊情况。 


注，似次幂”这一名称，是由 J . F . S te ff ensen 引进的。在许多作者中，是他头一 
位一般地研究了这些多项式的令人惊奇的性质 [ Acta . Mathematka 73 (1941),333 〜 

366]。关于文献的综述，以及关于在以下好几道题中的课题的进一步讨论，参见 D . 
E . Knuth ， T 7 ie Mathematica Journal 2 (1992) ，67〜78。在该篇论文中的结果之一^， 


如果 V \ 



以及当 : r 


00和 n 


CO 


时 


: y 


njx 有界，则有渐近公式 




X 


e 


xV(s) I H 

\ ts 


0(v 


0( x 


- l 


)) 


18 .我们有 V n (x 


E k x k n \[ z n ] V ( z ) k / k \ 


因此当 n >0 时， 


V n ( x)/x 




( n - l )\[ z n 


- 1 


； V / ( z ) e xV(z) 


通过在 V ' ( z ) e u + y)v(z) = V / ( z ) e J:v(z) 


e 


y ^( z ) 


中等置/ 


一 1 


的系数，我们得到所述的恒等式。 


19.由多项式定理 1.2. 6-(42)，我们有 


L 二 


71 ! 


m \ 


Z i \ l ^ z + 2 \ z 


+ 3 \ z 


m 


+ 


s 


々 • + 灰 〜 + “• + 走 




m 


__ / Vi 

々 i !々2! … 々 J l 1! 


V 2 

2 ! 


V 


n : 


n 


k 4 +2^ 


2 


+ Tik 


k j .裊 2 >0 


这些系数也出现在习题 1.2.5-21 的 Arbogast 公式中，因此如同在该习题的答案中 
所说明的那样，我们可以把这些项同集合的分划相关联。递推式 






n ~ 1 
1 ~ 1 




表明如何由列1和列 a -1 来计算列々 


由于有 


n ~ 1 
1 - 1 


种方法在大小为7的一个子 


集中包括元素 n ， 这是容易相对于|1，…， nl 的分划解释的。矩阵的开头一些行是 


^1 

^2 v \ 

^3 3 ^! V 2 v] 

^4 + 3 t ；2 V2 v\ 

幻 5 + 10t ；2 ^3 15?^ 4 + lOwf 10v\ Vi v\ 

20‘ [ 〆 ]= A ([ d ] uu )々）（[ 〆 ] VUV ); 因此 ^ = ( n \ lk \) - 
S ; u jk ) (( j\l n \) v nj ) o [ E . Jabotinsky , Comptes Rendus Acad . Sci . 224 

( Paris ，1947)，323 〜324。 ] 
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习题答案 


2 La ) 如果 LT ( z ) = aW (/ fe )， 我们有 ^ IV ] UW ( " U ) ” ;特 

别是，如果 U ( Z )= V [ ^ ] ( z )= - W (- z )， 我们有〜=(_1)”所以由习 

题20,对应于单位函数之。 

b ) [由 Ira Gessei 给岀的解。]事实上，这个恒等式等价于拉格朗日的反演 公式: 
我们有 w nk = ( - l ) n ^ k u nk = ( - l ) n - k ~[ z n ] V [_ u U )\ 而且由习题 16,在 

中/的系数是[《” _1 ]以” + 卜 1 / VU )”。 另一方面，我们已经把 
定义为 （ 心） r ”， 它等于 （—-1 ) … u + 

mi ;， 1 v + 卜 1 / v ( z )、 

22. a ) 如果 V (z) ^ U ul ( 2 ：) 和 W (z) = V l/31 U )， 我们有 W (z) = 
V(zW(z)^)= U(zW(z) /3 V(zW(z)^) a )= U(zW(z) a + /? ) 0 (注意这个定律和适 
合于迭代的类似公式 U [l] (z)= U(z),U [a][ ^ ] (z)= L 7 [4] U ) 之间的对照。） 

b ) 3 (2) (4是对于 2.3.4.4-(12) 的二叉树的生成函数，它是在算法 L 之后的例 
子 z = t - t 1 中的 W(z)lzo 而且，是习题 2.3.4.4-11 的 z 叉树的生成函 

数。 

c ) 提示等价于 zU lal (z) a = W [— 1] U )， 它等价于公式 zU lal (z) a l 
L / UL 7 ul U) a )a = z 。 现在拉格朗日的反演定理（习题 8) 指出，当 x 是正整数时， 

= (这里 是一个 Laurent 级数 - 

n 

个幂级数除以 Z 的幂； 我们可以使用符号既表示幂级数也表示 Laurent 
级数。）因此当 x/a 是正整数时，[之”] U U1 U；T = [z n ](W [ ~ l] (z)lz) xla = [ z n + xla ]- 

W [- l]( z )i/a 等于 xla [ z -xia^ W( ^ z y,-xla = 工 [Z ~ xl ° ] Z ~ ^ ~ xl °U ( z) X + na 0 

n + xl a x na 

对于无穷多个 a 我们已经验证了这个 结果； 因为 u la ] ( zy 的系数是 a 的多项式，因 
此这是充分的。 

在习题 1.2.6-25 和 2.3.4.4-29 中我们已经看到这一结果的特殊情况。提示的 
一个可记忆的结果是 a = -1 的 情况： 

W(z) = zU(z) 当且仅当 W [- 1] U ) = zlU l ~ U (z) 

d ) 如果 L 7 Q = 1 和是对于 VU ) = lnL 7 U ) 的似次幂，我们刚才已经证明 

m)/U + na ) 是对于 lnL / lal U ) 的似次幂。所以我们可以把这个似次幂插 

入到以前的恒等式，在第二个公式中把: y 改成 

23. a ) 我们有！7=了+了，其中 ： P 在小于等于 n 的行中为零。因此 In U=T~ 

1 T 2 + | T 3 -…将有（―⑺ 二 j + (?)了+ (=) T 2 + … = a 的性质 。 w 的 
2 3 \ 1 / \2 / 

每个元素是 a 的一个多项式，而且每当 a 是正整数时习题19的关系 成立； 因此对于 
所有 a ， W 是一个幂矩阵，而且它的头一列定义 U [ Q ] ( z )。 (特别是， U - 1 是一个幂 
矩阵； 这是反演 L /( z ) 的另一个方法。） 
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4 刀节 



b ) 因为 L / = / + dnLJ + 0(^ 2 )，我们有 




[ f ](z + eL ( z ) + 0 G 2 ))々 




c ) 


a 




3 a 


U 


[a] 


(之） 


u 



= [ dL 7 [ fl + < ] U )， 而且我们有 

( z ) = U [ a ] ( U [(] ( z )) = U [a 


Z + 丄 （ Z) + OG 2 )) 


还有 

U [a + <] (z) = u (l \u [a] (z)) = u [a] (z) + <L(U [a] (z)) + OG 2 ) 
d ) 由 17 同 In 17 可交换这一事实，得出这个恒等式。当 n >4 时它确定 

因为左边匕—的系数是_ 2 ,而右边的系数是 = (^)^20 类似地，如果 “2 = 
…== 0和1^关0,我们有4 = W ，而且对于 n >2 k 的递推确定 lk + i ， ho , …' 

左边有+ (々二丄 + +…的形式，而右边有 L + +…的形式。 


一般说来，/2 = U 2 J 3^ U 3 ~ 



= W 4 _ 5 W 2 ^ 3 



2 


ulJs 





185 



u 2 u 3 


~ 20^2 


0 


e ) 我们有 L /= S w (ln LOlm !， 而且对于固定的 


贡献是对于 72 = /2 w > …〉求和的 w 

rn 


m 从第 m 项起对 ' = w nl 的 
… L „ n l n n 。 现在应用 b ) 的 

2 1 t 0 


结果。[参见 TVans . Amer . Mafh . Soc . 108 (1963)，457 〜 477。] 

24. a ) 由 （21) 和习题20,我们有 U = VDV - 1 ， 其中 V 是 Schroder 函数的幂矩 
阵，而 D 是对角矩阵 diagU ， w 2 , w 3 , …）。所以我们可以取 In L 7 = Vdiag(ln u , 
21 n u ,3 In 等式 WVDV 1 = VDV 1 W 意味着 （V 1 WV ) D = 

D ( V - 1 WV ) 0 D 的对角元素是不同的，所以 V — 1 WV 必定是对角矩阵 IT 。 因此 

w = wy V -1 且 W 有和 U —样的 Schroder 函数。由此得出，尹0和 W = 


VJTV -1 ， 其中 a = (In W^Kln L / J 。 

25 .我们必定有 々 = ZJ *[ z 々 + h ]u(v(z))=l ^ + / — 1+ ^ + /-1 + kU k V to 

为完成证明，只须证明 V ^和 U ( V ( z ))= V ( L 7( z )) 意味着 U ( z ) = V ( z ) 0 
假设 Z 是满足 V ^ Vt 的极小值，并令 n = k + I _ 1。 于是我们有= 


n 


(uf ~ % ); 对于所有 j > k ， u nj 


n 


^nj •， U n i 



W ; 以及对于 1< j < n ， u nj 


0 


0 


现在和 YjjU nj Vj = U n + U nk v k + • 


# # 



^nl 



V n 必然等于 2^^; 所以我们求得 



…)。但我们有 h ) 


/ ^ + / - 1 \ 

当且仅当々 

\ 1/ / 



[由本习题和上一习题，我们可以猜测仅当 u 和 V 之一是另一个的迭代时， 
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题答案 


U ( V ( z ))= V ( U ( z 、）。 但当 R 和 R 是单位的根时，这并非必要。例如，如果 
% = -1 和 U ( z ) = V [2] U )， V 不是 U [ 1/2] 的迭代，[/[ 1/2] 也不是 V 的迭代。] 

26•写 U ( z )= L ； [0] U 2 ) 十 ^/ [ u U 2 )， 我们有 U ( V ( z ))^ U [0] ( V lZ 2 + V 2 z 4 
+ •••)+ V ( z ) U [ l ] ( V 1 z 2 + + … ）（modulo 2)。 运行时间满足 T ( N ) = 2 T ( N / 

2) + C ( N )， 其中 C ( N ) 实质上是模多项式乘法的时间。通过比如说习题 4.6.4 
-59 的方法，我们可以使 C ( N )= 0( N 1 + f ); 也可参见习题 4.6-5 的答案。 

一个类似的方法在 0(/> N 1 + ( ) 的时间内进行模户的运算。 [ D.J .Bernstein J . 
Symbolic Computation 26 (1998) ，339〜341。 ] 

21, A ( W ( qz ) ~ W ( z )) V ( z ) = W ( z )( V ( q rn z ) - VU )) ，我们得到递推式 
W n = Tjk^i v k w n -k ( q km - q n ~ k )1( q n - 1 )o [ J . Difference Eqs . and Applies . 16 

(1995)，57 〜 60。] 

28 .首先注意 ^ U ( z ) V ( z )) = UU ( 2 ：)) V ( z )+ L /( z ) UV ( z)) ，@S t ( mn ) 
= t ( m ) + t ( n ) o 因此对于所有由对 72 的归纳法，以 V “广 ）= ” V “^ 1 
W ( z ); 而这是我们要来证明 h v(z )= VU )”/”!）= e v ⑴ WU ) 的恒等式。 

在这个等式中以 In V ( z ) 代替 V ( z ) 给出 V ( z)d In V ( z ) = 8 V ( z ); 因此对于所有 
的复数， 广 ）= ln v(z ) = e aln v ⑴古 U In V(z ) ) = a V(z ) Q — 1 。 

由此得出所想求的递推式是 

( a ) = 1， + l ) t ( d ) lt ( n ) - l ) V d W njd ; 

( b ) W ! = 1， W „ = ' E dXnid > l ( t ( d ) lt ( n )) V d W n i d ; 

(C) = O.W n = + Yj d \ n ’ d>1 “⑻ ltd ^ V dWnido 

[参见 H . W . Gould , AMM 81 (1974)，3 〜14。当 Z 是任何使得 Z ( m ) 十 t ( n )= 

KmrO 和 Krz )=0 的函数时这些公式成立当且仅当72 = 1，但所建议的《是最简单 
的。这里讨论的方法对于任意多个变量的幂级数也有效；于是，是一项的总次数。] 


“ jt is certainly on idea you hove there ，” so/d Poirot y wUh some interest. 

“ Yes ， yes ， ! ploy the port of the computer . 

One feeds in the information ——” 

And supposing you come up with oil the wrong answers^' soid Mrs. Oliver . 

“ That would be impossible ，’’ soid Hercule Poirot. 

“ Computers do not do that sort of q thmg, ” 
“ They’re not supposed to y n soid Mrs . Oliver ， 
“but you'd be surprised ot the things that happen sometimes . ，5 

“你说的还挺有道理， ff Poirot 饶有兴趣地说。 

“是的，是的，我还真像是台计算机。” 

“你输入信息 ——” 
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“要是你出来的结果是错的呢?” Oliver 夫人问 0 

“那不可能，” Hercule Poirot 答道，“计算机不会出错的 

“应 该说不会，，， Oliver 夫人说，“但有时结果会出乎意料。’' 

—AGATHA CHRISTIEwe en Party (1969)" 


此段对话出自阿加莎•克里斯蒂侦探小说《万圣节前夜的谋杀案》第 6 章。——本书责任编辑 


• 717 • 


附录 A 数值数量表 


表 1 在标准子程序和对计算机的程序的分析中 

经常使用的数量（到小数点后 40 位） 

^2= 1.41421 35623 73095 04880 16887 24209 69807 85697 - 

^3 - 1.73205 08075 68877 29352 74463 41505 87236 69428 + 

^[1: 2.23606 79774 99789 69640 91736 68731 27623 54406 + 

715= 3*16227 76601 68379 33199 88935 44432 71853 37196- 

^2= 1.25992 10498 94873 16476 72106 07278 22835 05703 - 

^3= 1.44224 95703 07408 38232 16383 10780 10958 83919 - 

^2 = 1.18920 71150 02721 06671 74999 70560 47591 52930 - 

In 2= 0.69314 71805 59945 30941 72321 21458 17656 80755+ 

In 3 - 1.09861 22886 68109 69139 52452 36922 52570 46475 - 

In 10= 2.30258 50929 94045 68401 79914 54684 36420 76011+ 

l/ln 2= 1.44269 50408 88963 40735 99246 81001 89213 74266 + 

1/ln 10= 0*43429 44819 03251 82765 11289 18916 60508 22944 — 

tt= 3.14159 26535 89793 23846 26433 83279 50288 41972 - 

r = 1t /l80^ 0.01745 32925 19943 29576 92369 07684 88612 71344 + 

1/tt 二 0.31830 98861 83790 67153 77675 26745 02872 40689 + 

7 T 2 二 9.86960 44010 89358 61883 44909 99876 15113 53137 - 

Wr = r(l/2) 二 1 ■ 77245 38509 05516 02729 81674 83341 14518 27975 + 

r(l/3) - 2.67893 85347 07747 63365 56929 40974 67764 41287- 

r(2/3)= 1.35411 79394 26400 41694 52880 28154 51378 55193+ 

e 二 2.71828 18284 59045 23536 02874 71352 66249 77572 + 

lle= 0.36787 94411 71442 32159 55237 70161 46086 74458 + 

e 2 = 7.38905 60989 30650 22723 04274 60575 00781 31803+ 

y 二 0.57721 56649 01532 86060 65120 90082 40243 10422 - 

In 7t 1.14472 98858 49400 17414 34273 51353 0587) 16473 - 

♦二 1.61803 39887 49894 84820 45868 34365 63811 77203 + 

e y = 1.78107 24179 90197 98523 65041 03107 17954 91696 + 

e^ 4 = 2. 19328 00507 38015 45655 97696 59278 73822 34616 + 

sin 1 = 0. 84147 09848 07896 50665 25023 21630 29899 96226 - 

cos 1= 0.54030 23058 68139 71740 09366 07442 97660 37323+ 

- ^(2) - 0.93754 82543 15843 75370 25740 94567 86497 78979 - 

C(3)= 1 . 20205 69031 59594 28539 97381 61511 44999 07650 - 

0,48121 18250 59603 44749 77589 13424 36842 31352 - 

H [ n <#>= 2.07808 69212 35027 53760 13226 06117 79576 77422 - 

-In In 2 ^ 0.36651 29205 81664 32701 24391 58232 66946 94543 - 
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附录 A 数值数量表 


表 2 


在标准子程序和对计算机程序的分析中经常使用的数量（到八进制 45 位 ) 


(M 


0.01 


0.001 


0.0001 


0.00001 




0.000001 = 


0.0000001 




0.00000001 


0.000000001 


0.0000000001 




n 

V 3 




41 二 


/To 

n 

n 




In 2 


In 3 


In 10 


1/ln 2 
1/ln 10 




K — 




tt/180 = 

1/丌= 


丌 


▲= m /2) = 


Ji 


左边的名称是以十进制记号给出的 




am mu nsu hsv>h 6ms Uhs^ nm “m — 

C.GG5G7 5HH iUU HUS 6(1501 5HU iUU UU5 605U - 


. oono sius sksn ssns mss hhuh 


\nsk 


ncu 


O.OGGC! N 556 i^SU Uhik 5k5U ISiU 3 W1 15 C' G 2 


0.G0CG0 OUSi SlHh C55H SSiSi 55^1 (HUS hhhU 


um 5 nkh r ^75 mn siu ^ c5 3 u wn 


urm uns 5^sn 25 m mv 之 sssht sms ksoso 


⑷ 7 SSlht iOHh Hti5 \hlU SUSO 5S0U UiS"i 


0 .nns 155 sink n^si nno hnsi sons 15156 


n.mn ihk 6 i 6 ⑴ 5 um ussi isus noti 


uiw sues mn asm nm hosio 15 m Hhn 


hhm 




5 ^ 3 - 


O.COOGG ihlSi 10 6 6 h UOhi HOT! iUCI 5 6 G 6 3 Wiil 


sen 


G.C0GC6 CC15 L J HUS ]5tU SHhh UUi UUt HUh CV\5i 

g^cgocg mu 57in 56iG6 GhU^ vim 11 m asi^ am 

C\G0GGG OGGCi OkSSO H6JiG hSSSS UhU hOiH l\Ul 

g.ogggg non U6is mss 55 m 55 m m “ nni cm] 

nsu msi uuc ssus hsns nsn 

'1.5666! 656J^j UlU l5iS^ SOISS 6GU1 HCU him - 

men nm sini hnn snu acc5 mu sssu nni - 

hum horn 6hsss nhhk ntki 57101 hihss mis nsr^ 


^^5 05 05 7 H 15HS osnt 1G7 5S S5Wi 155U Uhi5 OUH 


+ 


SGiU - 


Ki 協 7 UG50 “556 1H5 5 UiS^ ShhH SO Vli 62755 1UH 

0.5U71 G1 7 7 5 750 7 1 5 7 1 1 7 0 73U 50GC7 UHS SHhO 

.^^7 um 55006 05 ⑴ mhO SUSS Ui}\l 1557 k SSU1 


sens 


+ 


i^nui issn sues non nw ^ns mu ssns cusi 

■ 

ISk^S U 5 U hiSih mn 5 J 5 M H 655 ihISS UUO 


21 iU 


c^Gicn nis^ iun nnh isui sbtn n 川 noss ushh 



UCol 


kossh moi 


irnt 


、 作者计划在本书下一版中给出这些常数的 36 位十六进制值，而不是现在的 45 位八进制值。——本书 
责任编辑 
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附录 A 数值数量表 


r(i/3)- 

^5Wi7 


51013 

6W6 

r(2/3) = 


57m 

\h\n 


e = 

t.ssno 

StiU 

5G5S5 

5ms 

l/e = 

(L2UU 

suss 

13W 

H761 

e 2 = 

1 JOUh 

hSSiS 

mss 

VshSO 


(j.hkni 

U770 

snss 

OSiU 

In 7c = 


hOhh^ 

h75G5 



i.hnn 

SUSS 

msi 


e 7 = 

i .sun 



ssm 

e^ 4 = 

t5 

mu 

16ia 

5^m 

sin 1 ― 

0,65^65 

HhH 

(I Hi Ji 

nm 

cos 1 = 

0.hth50 

56GV 

nku 


- ((2) = 

0.UGG1 

hSUh 

JJI5J 

him 

?(3) = 

i .UU5 

coon 

aooih 

UhlO 

In 今 = 

o.nsn 

mss 

■ 

“川 

oim 

1/ln ^ = 

i.mn 

SO111 

ilihh 

hiSit 

-In In 2 = 

OAVsSi 


sms 

SH50 


(续) 


mas 

hUkh 

5h65S 

com 

660h6 - 

shsn 

S 7655 

sam 

nm 

0H5U 

5nn 


COJill 

mn 

61“1 + 

511U 

7 5hH 

onko 

5"71 

GU55 + 

nso7 

nOhO 

nfjSk 

Mm 

50”7 + 


um 

oim 

51313 

USU - 

65in 

SUSi 

5H10 

S15U 

JiS057 + 

mu 

UhOi 

hO^U 

S6U0 

15010 + 

nim 

S655! 

ssm 

USSk 

uno + 


ant 

5J5I5 

kkm 

mu - 

GHS7 

nnh 

11m 

onn 

U505 - 

onu 

us “ 


1U15 

inn ^ 

^un 

nsso 

soon 

JiSiGO 

mu + 

1561 C J 

hUSi 

W15 

nm 

0S6U + 

woo 

hiOOh 

sun 

woo 

JfOSU + 

UhH 

U5U 

00S55 

bnn 

綱 5f + 

inoi 

56U1 

mu 

Ult55 

57005 - 


在本书的第1版中，表1中的一些40位的数值是由 John W . WrenchJr . 在一架 
台式计算机上计算出来的。到了 20世纪70年代，当做此计算的计算机软件出现 
时，证明了他所做的所有计算都是正确的。在等式4.5.2-(60)，4.5.3-(26)，4.5.3_ 
(41 )，4> 5.4-(9) 以及习题 4.5.4-8,4.5.4-25,4.6.4-58 的答案中，可以找到其它基 

本常数的40位的值。 


表3对于小的《值，调和数、伯努利数以及斐波那契数的值 


n 


B n 

F n 

n 

0 

0 

1 

0 

0 

1 

1 

- 1/2 

1 

1 

2 

3/2 

1/6 

1 

2 

3 

11/6 

0 

2 

3 

4 

25/12 

-1/30 

3 

4 

5 

137/60 

0 

5 

5 

6 

49/20 

1/42 

8 

6 

7 

363/140 

0 

13 

7 
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附录 A 数值数量表 



n 


B n 

F n 

n 

8 

761/280 

- 1/30 

21 

8 

9 

7129/2520 

0 

34 

9 

10 

7381/2520 

5/66 

55 

10 

11 

83711/27720 

0 

89 

11 

12 

86021/27720 

-691/2730 

144 

12 

13 

1145993/360360 

0 

233 

13 

14 

1171733/360360 

7/6 

377 

14 

15 

1195757/360360 

0 

610 

15 

16 

2436559/720720 

-3617/510 

987 

16 

17 

42142223/12252240 

0 

1597 

17 

18 

14274301/4084080 

43867/798 

2584 

18 

19 

275295799/77597520 

0 

4181 

19 

20 

55835135/15519504 

—174611/330 

6765 

20 

21 

18858053/5173168 

0 

10946 

21 

22 

19093197/5173168 

854513/138 

17711 

22 

23 

444316699/118982864 

0 

28657 

23 

24 

1347822955/356948592 

- 236364091/2730 

46368 

24 

25 

34052522467/8923714800 

0 

75025 

25 

26 

34395742267/8923714800 

8553103/6 

121393 

26 

27 

312536252003/80313433200 

0 

196418 

27 

28 

315404588903/80313433200 

-23749461029/870 

317811 

28 

29 

9227046511387/23290895662800 

0 

514229 

29 

30 

9304682830147/2329089562800 

8615841276005/14322 

832040 

30 



对于任意的： c ，命氏二 



Hi/2 = 2 - 2 In 2 


，于是 




721 


附录 A 数值数量表 


H 


1/4 


= 4 - 


2 


丌 


一 3 In 2 


H 


4 


3/4 




2 


TC 


- 3 ln2 





5 - 专 W 3/2 5_ 1/4 - fin 5 - 2 


\f5 In 



H 



2/5 


2 


2 


丌 




^3/2^-1/4 _ 




In 5 + 


1 


2 


V3 In 



H3/5 




+ 


2 


丌 




-3/2c-l/4 




- —In 


4 




2 


v^5 In 



H4/5 



4 



2 


丌彡 


3/2r-l/4 




4 


In 5 - 


2 


V5 In 




Hi/ 6 = 6 - — - 2ln 2 - ~ln 3 


2 


2 


W5/6 





2 


TC 


^3 — 21n 2 — 



2 


In 



而且， 


般地，当 0< p < g ( 参见习题 H 9-19) 时， 


Hpln 二 J~f COt f 7r_ln2(? 



2 



n < ql2 


2 pn 

cos 一 ^ tc 

Q 


In sin 


n 


n 


Q 
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附录 B 符号索弓 


在以下的诸公式中，未被进一步定性的字母有如下的 意义: 
j , k 整数值算术表达式 
m , n 非负整数值算术表达式 
oc y y 实数值算术表达式 
z 复数值算术表达式 
/实数或复数值函数 


S , T 集合或多重集合 


形式符号 

意 义 

定义的位置 

1 

算法，程序或证明的结束 

1.1 

或 A [ n ] 

线性数组 A 的第《个元素 

1.1 

A ㈣ 或 A[ rn ^ 

:矩形数组 A 的第 w 行第 n 列元素 

LI 

V<-E | 

把表达式£的值赋给变 M V 

1.1 

U 一 V 

:交换变董 L 7 和 V 的值 

1.1 


条件表达式，如果 B 为真指向£，如果 S 为假则指向£/ 


B 

■ 

条件 B 的特征函数 （ B =>1 ;0) 

1.2.3 

各 kj 

Kronecker S：[j — ^ ] 

1.2.3 

iz n )g{z) 

在幂级数 g(z) 中/ 的系数 

1.2.9 

E/u) 

R(k) 

使得变童々为整数且关系尺 U ) 为真的所有 / U ) 之和 

1.2.3 

11/ ⑴ 

R(k) 

使得 变量々 为整数且关系尺 U ) 为真的所有 / U ) 之积 

1.2.3 

min /^ 

R(k) 

使得变 M 々为整数且关系尺 U ) 为真的所有 / U ) 之极小值 

1 上 3 

max f(k) 

R(k) 

使得变景々为整数且关系尺 U ) 为真的所有 / U ) 之极大值 

1丄3 

ytz 

Z 的实部 

1.2.2 


Z 的虚部 

1.2.2 


复共轭：9^ 

1.2.2 

a t 

矩形数组 A 的转贯 ： A t [ 7 , A ]- A [ 々，_；_] 

1.2.3 


■r 的 jy 次方（当： r 为正时） 

1.2,2 

x k 

•r 的 A 次方： u >0 令 TT X ； \lx^ k ) 

0<j<k 

1,2.2 

工 1 

\ 

x 的々升 阶乘 ： ru + 是） / ru )= n (x^j) ； il(x + y )~ k ) 

^j<k 

L 

1.2.5 
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附录 


符号索引 


形式符号 





1的々降阶乘 ^ /( r *”=(0。，及户-仏心― _) 


(续） 


定义的位置 




X 


fix ) 

f ( 工、 

f ( n \ x ) 

f [ n ] ( x ) 


lw, (x) 



H 


(: r) 


n 的 阶乘： r(w 十 1) = # 

/ 在 _ r 处的导数 
/在: C 处的二阶导数 

n 阶导数 ：（《=0$/(：0;^(工）），其中 g ( x )= f { 

第 n 次迭代：（/2=0=^ ; /(广 _1] (: c )) 

% n 次归纳函数 ：/ U | (: r )=/(: c / U | Ur ) 


阶为 


x 


的调 和数 ： S 1/严 


°( x ) 


.2.5 
1.2.9 
. 2.10 
2 . 11.2 
4.7 


4. 


1.2.7 




H 


调 和数： 


1.2.7 


F 


斐波那契数 ： （ n < l 4 r 2 ; F 


+ F _ 


1 . 2.8 


B 


X 鲁 Y 


伯努利数： w ![2：”]2：/( e z - 1) 


向量 X 


A ，…， ) 和 Y -( y [ 


，: yj 的点乘 



… 十 ^ny 


2 . 11.2 

3 . 3.4 


j \ ^ 

S\T 

㊉ ©® e > 

(… apo, a _! 


畚 》■ 


j 整除々：是 mod j -0 Kj >0 
集合差 ：la la 在 S 中且 a 不在了中! 
舍人或特殊运算 
h 6迸制的按位表示少 


II x 、、：^ 、… 、工 n ll 连分数： 1/(11 + 1 /( 1 2 + 1 /(〜+ 1 /(^ 0 " 0 )) 


0 


项式系数 ： （A < 0=>0; x~l k \) 


1.2.4 


4.2.1 


4.1 


4.5. 


1 . 2 . 


n 2 


m 


m 


} a \ R ( a )\ 


多项式系数（仅当 n 二心+打 2 


■ » » 


第一类斯特林数: 




0< W 


<k 


第二类斯特林数: 


S 




+ 时才有定义) 


k { k 


a m m 


< n 


k [ k 


« « » 




使得关系 i ? u ) 为真的所有 0 的集合 


1 . 2.6 


1 . 2.6 


1 . 2.6 


… ，〜 


集合或多重集合 


X 


分数部分(用于意味着是一个实数值而不是一个集合的上下文中）：工- L«x 


• 2 . 11.2 


[a , b ] 


闭区间 Ula <: r <6 


1 . 2.2 


(a , b ) 


开区间 UU < x <6 i 


1 . 2.2 


[a y b ) 


半开 区间： 


1 . 2.2 


( a ， b ] 


半闭 区间： UU < x <6 l 


1 . 2.2 


IS 


基数：在集合 s 中元素的个数 
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附录 B 符号索弓 i 


(续) 


1 形式符号 

意 义 

定义的位置 


X 的绝对值： （ X X \ ^ x) 

z 的绝对值： \ T^i 

1 .2.2 

L :」 

x 的底限函数，即最大整数函数 •. max^J 

1.2.4 

「:1 

顶限函数，即最小整数函数： min»> 

1.2.4 

(U)) 

锯齿函数 

3.3.3 

00 

无穷序列，…（这里字母 /2 是符号的一部分） 

1.2.9 

Y 

欧拉常数 - In r?) 

1.2.7 

7(x,y) 

不完全 r 函数： e~'t x ~ ] dt 

Jo 

1.2.11.3 

ru) 

r 函数 ：（：c - 1)! =y(x,^>) 

1.2.5 

six) 

整数的特征函数 

3.3.3 


自然对数 的底： E„ >(] l/n! 

1 .2.2 


(函数当 i>l 时） 

1.2.7 

K n (x [t t x n ) 

连续多项式 

4.5.3 

i(u) 

多项式《的前导系数 

4.6 

l(u) 

对于 rz 的最短加法链的长度 

4.6.3 

A ( n ) 

Von Mangoldt 函数 

4.5.3 

〆 w ) 

Mobius 函数 

4.5.2 


边路和 

4.6.3 

0(/(”)） 

当 W—0O 时， /(„) 的大 0 

1 .2.11] 

0(f(z)) 

当 z~*0 时， /( z ) 的大 0 

1 .2.11] 

n(/(«)) 

当 n — oo 时， /(„) 的大 n 

1 .2.1 M 

©(/(«)) 

当 72 — OO 时， /( n ) 的大0 

1 .2.11.1 

7C( JC) 

素数计数 S < 是素数] 

4.5.4 


圆周率 :4 >n (- 1 广 /(2” + 1) 

4.3.1 


黄金比 ：+(1+乃） 

1 .2.8 

0 

<p( n) 

空集 ： Ulo = i 

欧拉 9 函数： S a < i < rl i > 丄”] 

1.2.4 

oo 

无 穷大： 比任何数都大 

4.2.2 

det ( A ) 

矩形数组 A 的行列式 

1.2.3 

sign ( 二） 

deg ( u ) 

x 的符号： （ a: = 0=>0 ;xl\ x\) 

多项式 w 的次数 

4.6 
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附录 B 符号索引 


形式符号 


cont( u ) 

pp (& (: r)) 

logp 


意 


义 


in 


X 


tg X 


exp x 

gcd(j f k) 
lcm( j ， k) 
x mod 3 ; 


多项式 〃 的容度 
多项式 M 的本原部分 

( 当： r>0,6>0 和6 ^1 时 U 的以6为底的对数，即使得 ：^ = ^ 的 ） 值 
自然对数 ： log e :r 


二进制对数 bg 2 


X 


X 


的 指数 : 


e 


j 与 k 互索 : gcd(j ,^)-1 
j 和々 的最大公因子 = 々 = 0 => 0 ; max d) 

d \ j t d \ k 

j 和々的最小公倍数 ：（# = 0=>0; min d ) 

J>0,j \ d，k \ d 

mod 函数 ：（ 3 ； = 0 ^^: \x - : yLW ： y 」） 


ix) mod v(x) 多项式 u 除以多项式 p 之后的余式 
x = (modulo y) 同余关系 ：xmod ：y = jc'mod y 


Pr(S(n)) 

Pr(S(X)) 


X 


近似地等于 : y 


E X 


mean( g) 


var(g) 


(min 


Xy ,ave x -2 


max : r 3 , dev x 4 ) 


rA 


rX 


rll ， … ， rI 6 


对于随机正整数 n ， 命题 S («) 为真的概率 

对于 X 的随机值，命题 s(x ) 为真的概率 
X 的期望值 ：^ x Pr (X - 

1 J ： 


x) 


由生成函数 g 表示的概率分布的均 值： 〆 （1 ) 

由生成函数 g 表示的概率分布的方差 j 〃（ i) + g / (D - gW) 1 


有极小值 A ，均（期望 ) 值 :c 2 , 极大值 Jt 3 , 标准差 x 4 的一个随机变量 


rj 

(L:R) 

OP ADDRESS ， 1(F) 


u 


0F ， 1F,2F, … ,9F 


0B ， 1B,2B ， … ,9B 


0H ， 1H,2H ， … ， 9H 


个空格 
MIX 的寄存器 A ( 累加器） 

MIX 的寄存器 X( 扩充） 

MIX 的（变址）寄存器 I, ， … ，1 6 

MIX 的（转移）寄存器 J 

MIX 字的部分字段 ， 0<L<R<5 

MIX 指令符号 

MIX 中的时间单位 

MIXAL 中的 “ 本身 ” 

MIXAL 的 “ 向前”局部符号 
MIXAL 中的 “ 向后”局部符号 
MIXAL 中的 “ 这里”局部符号 


定义的位置 


4.6.1 


4.6.1 

1 . 2.2 
1 . 2.2 
1 . 2.2 


1.2.9 

1.2.4 

4.5.2 

4.5.2 


1.2.4 


4.6.1 

1.2.4 


3 


4.2.2 


3.5 


1 . 2.10 


1 . 2.10 


12.10 


L2.10 


1 . 2. 10 


1.3. 


1.3.1 


1.3.1 


1.3.1 


1.3. 


1.3.1 


1.3.1,1.3.2 


1.3.1 


1.3.2 


1.3.2 


1.3.2 


1.3.2 
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Seek and ye shall find . 

寻找吧你会找到的 c 


Matthew 


7:7 


当一条索引所指页码包含相关习题时，也请参看对该习题的答案，以获得更进一步信息。习题答案未参与 
索引，除非其中有习题中未包含的话题。 


O-origin indexing 以 0 开始的下标 
[ 0 , 1 ) sequence [ 0 ， 1 ) 序列 
2 -adic numbers 2 -adic 数 
10 -adic numbers 10 -adic 数 


00 , representation of 无穷的表 7K 
00 -distributed sequence 无穷分布序列 
'/(Euler’s constant ) 欧拉常数 
tc( circle ratio ) 圆周率 
(: r) (prime count ) 索数计数 
今 ( golden ratio ) 黄金比 
logarithm of In ^ 


number system 令数系 
<p(/?) (totient function) 欧拉 9 函数 




见 Chi-square 


A priori tests 先验检验 
Abacus 箅盘 

binary 二进制算盘 

Abel,Niels Henrik, binomial theorem 阿贝尔，尼尔斯•亨 
里克二项式理论 

Abramowitz,Milton 阿布拉莫维茨，米尔顿 

Absolute error 绝对误差 

Absorption laws 吸收率 

Abuse of probability 概率滥用 

Abuse of theory 理论滥用 

ACC：Floating point accumulator 浮点累加器 

Acceptance-rejection method 接受一拒绝方法 

Accuracy of floating point arithmetic 浮点箅术精度 

Accuracy of random number generation 随机数生成 

精度 

Adaptation of coefficients 系数修正 


Add-with-carry sequence 带进位加序列 
Addition 加法 

complex 复数加法 
continued fractions 连分数加法 
double- precision 双精度加法 
floating point 浮点加法 
fractions 分数加法 
left to right 从左到右加法 
mixed-radix 混合进制加法 
mod m 模 w 加法 
modular 模加法 
multiprecision 多精度加法 
polynomial 多项式加法 
power series 幂级数加法 
sideways 侧向加法 
Addition chains 加法链 
ascending 递增加法链 
dual 加法链的对偶 
/ 0 P 加法链 


star 星加法链 


Addition-subtraction chains 加减法链 
Additive random number generation 加法随机数生成 
Adleman ， Leonard Max 艾德勒曼，伦纳德*马克斯 
Admissible numbers 允许的数 

Ahrens,Joachim Heinrich Liidecke 阿伦斯，乔基姆 • 

海因里希•卢德克 


Ahrens, Wilhelm Ernst Martin Georg 阿伦斯，威廉 • 
厄恩斯特•马丁 •乔治 

Akushsky, Izrail Yakovlevich ( AxymcKHH, H3paHJib 

只 K0BJieBH4) 阿库斯基，伊兹赖尔•雅科夫列维 


% 索引页码请关注 http://www• ndip. com■ cn/computer/taocp ， 以便及时获取。 - 本书责任编辑 
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奇 

al-Blrunl, Abu al-Rayhan Muhammad ibn Ahmad 阿尔 

- 毕鲁尼，阿布 * 阿尔 - 拉伊汗 * 穆罕默德 • 伊本•阿 
哈麦德 

al-Kashl, Jamshld ibn Mas ‘ Cud 阿尔 - 卡西，杰姆希德 • 

伊本•梅苏德 


al-Khwarizml, Abu 1 Abd AJiah Muhammad ibn Musa 

阿尔 - 科瓦利茨米，阿布阿布达 • 阿拉 • 穆罕默德 • 
伊本•穆萨 

al-Samaw’al( = as-Samaw’al) , ibn Yahya ibn Yahuda al 

-Maghribl 阿 尔 - 萨 马瓦尔，伊本 • 亚希亚 • 伊本 • 
亚护达 • 阿尔-马尼比 


al-UqlldisT,Abu al-Hasan Ahmad ibn Ibrahim 阿尔-乌 

克里迪西，阿布 • 阿尔 - 哈山 • 阿哈麦德 • 伊本*伊 
布拉希姆 


Aia-Nissila ， Tapio 
Aanen > Jack David 

AJdous t David John 
Alekseev, Boris 

BacHJibeBHq) 


阿拉 - 尼西拉，塔皮欧 
阿兰宁，杰克•戴维 
奥尔德斯，戴维•约翰 

Vasilievich ( AneKceeB, BopHC 

阿历克谢耶夫，波里斯•瓦西里耶 


维茨 

Aiekseyev, Valery 


Borisovich 


AneKceeB, Bajiepwfi 


BopncoBnq) 阿历克谢耶夫，瓦莱里•波里茨维 


奇 


Aiexi , Werner 亚里克西，沃纳 

Alford t William Robert 奥尔福德，威廉•罗伯特 

Algebra , free associative 自由结合的代数 

Algebraic dependence 代数相关性 

Algebraic functions 代数函数 

Algebraic integers 代数整数 

Algebraic mumber fields 代数数域 

Algebraic system 代数系统：元素及其上定义的运箅 

的集合，见 Field, Ring, Unique factorization do¬ 
main 


ALGOL language ALGOL 语言 
Algorithms 算法 ：在有 限步骤中将指定输入转换成 
指定输出的精确规则 

analysis of 算法分析 
complexity of 算法复杂性 
discovery 算法的发现 
historical development of 算法的历史发展 
proof of 算法证明 
Alias method 别名方法 
Allouche , Jean-Paul 亚鲁奇，琼-保罗 
ALPAK system ALPAK 系统 
Alt ， Helmut 阿尔特，赫尔穆特 


American National Standards Institute 


美国国家标准 


协会 

AMM lAmerican Mathematical Monthly 《美国数学 
月刊》 ：美 国数学会机关刊物， 1894 年创刊 

Amplification of guesses 猜测的扩大 
Analysis of algorithms 算法分析 
history 算法分析的历史 
Analytical Engine 分析机 
Ananthanarayanan , Kasi 阿南塔纳拉雅男，卡西 
AND( bitwise and) 逻辑乘，位 “ 与 ” 

Anderson , Stanley F 安德森，斯坦利 *F 

ANSI 见 The American National Standards Institute 


Antanairesis 安塔奈里锡斯 


Apollonius of Perga 佩加的阿波罗尼尤斯 
Apparently random numbers 明显随机数 
Apparition, rank of 出现的秩 
Approximate associative law 近似结合律 
Approximate equality 近似等式 
Approximately linear density 近似线性密度 
Approximation, by rational functions 有理函数逼近 
by rational numbers 有理数逼近 
Arabic mathematics 阿拉伯数学 
Arazi,Benjamin 阿雷兹，本杰明 
Arbitrary precision 任意精度，也见 Multiple-p recision 
Arbogast, Louis Francois Antoine 阿博加斯特，路易 

斯 • 弗兰科伊斯•安托万 

Archibald , Raymond Clare 阿奇博尔德，雷蒙德*克莱 
尔 


Arctangent 反正切 

Aristotle of Stagira , son of Ni comae bus 斯塔吉拉的亚 

理士多德，尼可曼彻斯之子 

Arithmetic 算术，见 Addition Comparison, Division, 
Doubling, Exponentiation, Greatest common divi¬ 
sor ,Halving, Multiplication, Reciprocal，Square 
root, Subtraction 
complex 复数算术 
floating point 浮点算术 
fractions 分数算术 
fundamental theorem of 算术基本定理 
mod m 模算术 
modular 同余算术 
multiprecision 多精度箅术 
polynomial 多项式算术 
power series 幂级数算术 
rational 有理算术 

Arithmetic chains 算术链，见 Quolyaomial chains 
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Armengaudjoel 阿门戈德，乔尔 
Arney James W 阿尼，詹姆斯 • W 
Arrival time 到达时间 
Arwin , Axel 阿尔文，阿克塞尔 
Aryabhata 阿里亚哈塔 

ASCII ： The American Standard Code {or Information 

Interchange 美国信息交换标准代码 
Ashenhurst ， Robert Lovett 阿申赫斯特，罗伯特•洛 
维特 

Associative law 结合律 
approximate 近似结合律 

Asymptotic values 渐近值：表达数值量趋向的极限 
特性的函数 

Atanasoff , John Vincent 阿塔纳索夫，约翰•文森特 
Atkin , Arthur Oliver Lonsdale 阿特金，阿瑟 • 奥利弗 • 

朗斯代尔 

Atrubin ， AJan Joseph 艾特鲁宾，艾伦 ■ 约瑟夫 
Automata (plural of Automaton) 自动机 (automation 

的复数形式） 

Automorphic numbers 自守数 

Avogadro di Quaregna e Cerreto f Lorenzo Romano 
Amedeo Carlo ， number 阿伏加德罗 * 迪•夸里格 
纳 ■ 厄 • 塞拉托，洛伦佐 • 罗马诺 • 阿米蒂奥 • 卡洛， 
阿伏加德罗常数 

Axioms for floating point arithmetic 浮点算术的公理 


6 -ary number 6 进数 
心 -ary sequence b 进序列 

Babbage, Charles 巴贝奇，查理斯 

Babenko, Konstantin Ivanovich ( BaSeHKO, Kohctshthh 

KBaHOBHM) 巴宾戈，康斯坦丁 •伊凡诺维奇 
Babington-Smith , Bernard 巴宾顿 - 史密斯，伯纳德 
Babylonian mathematics 巴比伦数学 
Bach,Carl Eric 巴赫，卡尔•埃里克 
Bachet,Claude Gaspard,sieur de Meziriac 贝彻特，克 

劳德 • 加斯 帕德，西尤尔 • 德 * 梅兹里亚克 
Bag 袋，包 

Bailey,David Harold 贝利，戴维•哈罗德 
Baker, Kirby Alan 贝克，柯尔比 * 艾伦 
Balanced binary number system 平衡二进（制）数系 
Balanced decimal number system 平衡十进（制）数系 
Balanced mixed-radix number system 平衡混合进制 

数系 


Balanced ternary number system 平行三进（制）数系 
Ballantine,John Perry 巴兰坦，约翰•佩里 
Bareiss , Erwin Hans 巴莱斯，欧文•汉斯 
Barlow,Jesse Louis 巴洛，杰茜•路易斯 


Barnard , Robert 巴纳德，罗伯特 
Barnsley, Michael Fielding 巴恩斯利，迈克尔•菲尔丁 
Barton,David Elliott 巴顿，戴维•埃利奥特 
Barycentric coordinates 巴里森特里克坐标 
Base of representation 表不的进制 
floating point 浮点表 7K 的进制 
Baseball 棒球 

Bauer,Friedrich Ludwig 鲍尔，弗里德里克•路德维 

格 

Baum , Ulrich 鲍姆，乌尔里克 

Baur, Walter 鲍尔，沃尔特 

Bays，John Carter 贝斯，约翰•卡特 

Beauzamy f Bernard 博扎米，伯纳德 

Beckenbach , Edwin Ford 贝肯巴赫，埃德温•福特 

Becker , Oskar Joachim 贝克尔，奥斯卡•乔基姆 

Bejian, Robert 贝简，罗伯特 

Belaga ， Edward Grigorievich ( Bejiara, S^yapA 

rpnropbeBHq) 贝拉加，爱德华•格里戈勒耶维 
奇 

Bell Telephone Laboratories Model V 贝尔电话实验 
室模型 V 

Bellman , Richard Ernest 贝尔曼，理査德•欧内斯特 
BerrOr，Michael 本 - 欧 ，迈克尔 
Bender ， Edward Anton 本德，爱德 华 k 安东 
Benford , Frank 本福德，弗兰克 
Bentley f Jon Louis 本特利，乔恩•路易斯 
Bergman ， George Mark 伯格曼，乔治•马克 
Berkowitz,Stuart J. 贝克威茨，斯图尔特 
Berlekamp , Elwyn Ralph 伯勒坎普，埃尔温•拉尔夫 
algorithm 伯勒坎普算法 

Bernoulli,Jacques ( = Jakob — James) 伯努利，雅克 

( = 雅各布 = 詹姆斯） 

numbers B„ 伯努利数 

numbers, table 伯努利数表 
sequences 伯努利序列 

Bernstein ， Daniel Julius 伯恩斯坦，丹尼尔•朱利叶斯 
Besicovitch，Abram Samollovitch ( Be3HK0BHH, A6paM 
CaiviOHjiOBHq) 贝西科维茨，艾布拉姆•萨莫尔沃 

维茨 

Beta distribution 分布 
Beyer, William Aaron 拜尔，威廉•艾伦 
Bharati Krishna Tirthaji Maharaja, Jagadguru Swami 
Sri,Shankaracharya of Goverdhana Matha 哥弗 
达那马塔的巴拉第 • 克里斯纳 • 蒂塔基•马哈拉雅 
• 贾加德古魯 * 斯威米 ■ 斯里，香卡拉克里亚 
Bhaskara Acharya I 巴斯卡拉•阿嘻利亚 一 世 
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Bienayme, Irenee Jules 比恩纳米，艾琳尼 • 朱尔斯 

Bilinear forms 二次线性形式 

Billingsley f Patrick Paul 比林斯利，帕特里克•保罗 

Bin-packing problem 装箱问题 

Binary abacus 二进算盘 

Binary basis 二进基 

Binary-coded decimal 二进编码的十进数 

Binary computer 二进计算机：主要处理二进数的计 

算机 

Binary - decimal conversion 二 进-十 进转换 
Binary digit 二进数字 

Binary gcd algorithms 二进制最大公因子算法 
compared to Euclid’s 与欧几里得算法比较 

extended 扩充二进制最大公因子算法 
Binary method for exponentiation 求指数的二进方法 

Binary number systems 二进数系 
Binary point 二进小数点 
Binary recurrences 二进递推 
Binary search 二分查找 
Binary shift 二进制移位 
Binary trees 二叉树 

BINEG BINEG 计算机 

Binet,Jacques Philippe Marie 比内，雅克 • 菲利普•玛 
丽 

identity ： S/= \ap: } T ， k= { = 

'Z^ia j y } y i k = \bk^k + 

ap k - a k b ) ) ( Xjy k - 比 

利特恒等式 

Bini, Dario Andrea 比尼，达里欧•安德烈亚 
Binomial coefficients 二项式系数 
Binomial distribution 二项式分布 

tail of 二项式分布的尾部 

Binomial number system 二项式数系统，见 Combina¬ 
torial number system 
Binomial theorem 二项式定理 

Birnbaum，Zygmunt Wilhelm 伯恩鲍姆，齐格蒙特 • 

威廉 

Birthday spacings 生日间隔 

BITtNordisk Tidskrift for Informations-Behandling } an 
internationaJ journal published in Scandinavia since 

1961 哥本哈根出版的一种信息处理杂志，创刊 
于 1961 年 

Bit :“ Binary digit” 位（比特） ：“ 二进制数字”，或 0 或 

1 

random 随机位 

Bitwise operations 按位运算，见 Boolean operations 
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Bjork,Johan Harry 比约克，约翰•哈里 
Blachman , Nelson Merle 布莱克曼，纳尔逊 •默尔 
Black box 黑盒 

Bleichenbacher ， Daniel 布莱肯巴切，丹尼尔 
B1 inn, James Frederick 布林，詹姆斯•弗雷德里克 
Blote,Hendrik Willem Jan 布洛特，亨得里克 • 威廉 • 

简 

Blouin,Francois Joseph Raymond Marcel 布劳因，弗 

朗科伊斯 • 约瑟夫 • 雷蒙德 •马 塞尔 

Bluestein,Leo Isaac 布卢斯坦，利奥 * 艾萨克 
Bium , Bruce Ivan 布卢姆，布鲁斯•伊凡 
Blum , Fred 布卢姆，弗雷德 
Blum,Lenore Carol 布卢姆，勒诺尔•卡罗尔 
Blum , Manuel 布卢姆，曼纽尔 
integer 布卢姆整数 
Bofinger,Eve 博芬格，伊夫 
Bofinger , Victor John 博芬格，维克多•约翰 
Bohlender, Gerd 波伦德尔，格尔德 
Bojanczyk , Adam Wojciech 博杰恩兹克，亚当•沃杰 
Bombieri , Enrico 邦比耶里，恩里科 
norm 邦比耶里范式 
Boolean operations 布尔运算 
and 与 

exclusive or 异或 
or 或 
shifts 移位 

Border rank 边界秩 

Borel,Emile Felix Edouard Justin 博雷尔，埃米尔•费 

利克斯 * 埃杜瓦德•贾斯廷 

Borodin, Allan Bertram 博罗登，阿伦•伯特伦 
Borosh,Itzhak 博罗斯，伊特扎克 
Borrow 借位：负进位 

Borwein,Peter Benjamin 博尔文，彼得*本杰明 
Bosma ， Wiebren 博斯马，威伯伦 
Bouyer, Martine 布伊尔，马蒂尼 
Bowden, Joseph 鲍登，约瑟夫 

Box,George Edward Pelham 博克斯，乔治 • 爱德华 • 

佩勒姆 

Boyar,Joan 博亚尔，乔 

Boyd y David William 博伊德，戴维•威廉 

Bradley , Gordon Hoover 布雷德利，戈登•胡佛 

Brakke ， Kenneth Allen 布雷克，肯尼思•艾伦 

Bramhall,Janet Natalie 布拉姆霍尔，珍妮特•纳塔利 

Brauer, Alfred Theodor 布劳尔，艾尔弗雷德•西奥多 

Bray ， Thomas Arthur 布雷，托马斯•阿瑟 

Brent , Richard Peirce 布伦特，理查德•皮尔斯 
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Brezinski, Claude 布里津斯基，克劳德 
Bhllhartjohn David 布里尔哈特，约翰•戴维 
Brockett , Roger Ware 布罗克特，罗杰•韦尔 
Brocot , Achiile 布罗科特，艾基尔 
Bronte , Emily Jane 布朗蒂，艾米利•简 
Brooks,Frederick Phillips,Jr. 小布鲁克斯，弗雷德里 

克*菲利普斯 

Brouwer ， Luitzen Egbertus Jan 布劳威尔，卢易特曾 • 

埃格伯特斯•简 

Brown , David 布朗，戴维，见 Spencer Brown 
Brown , George William 布朗，乔治•威廉 
Brown, Mark Robbin 布朗，马克•罗宾 
Brown ， Robert 布朗，罗伯特，见 Brownian motion 
Brown, William Stanley 布朗，威廉 * 斯坦利 
Brownian motion 布朗运动 

Bruijn，Nicolaas Govert de 布魯因，尼古拉斯•戈维特 

•德 

cycle 布鲁因循环 
Brute force 暴力，指硬算，蛮干 
Bshouty , Nader Hanna 毕肖蒂，纳德•汉纳 
Buchholz, Werner 巴克霍尔兹，沃纳 
Bunch, J ames Raymond 本奇，詹姆斯•雷蒙德 
Buneman , Oscar 邦尼曼，奥斯卡 
Biirgisser, Peter 伯吉塞，彼得 
Burks , Arthur Walter 伯克斯，阿瑟•沃尔特 
Burrus , Charles Sidney 巴勒斯，查尔斯•西德尼 
Butler James Preston 巴特勒，詹姆斯•普雷斯顿 
Butler,Michael Charles Richard 巴特勒，迈克尔 •査 
尔斯•理查德 

C language C 语言 

CACM : Communications of the ACM, a publication of 
the Association for Computing Machinery since 

1958 《 ACM 通信》，美国计算机协会出版物，创 
刊于 1958 年 

Cahen,Eugene 卡亨，尤金 

Calculating prodigies 计算天才 

Camion , Paul Frederic Roger 卡米昂，保罗•弗雷德里 

克•罗杰 

Campbell > Edward Fay, Jr. 小坎贝尔，爱德华•菲 

Campbell , Sullivan Graham 坎贝尔，沙利文•格雷厄 

姆 

Cancellation error 消去误差 
avoiding 避免消去误差 
Cantor , David Geoffrey 坎托，戴维•杰弗里 
Cantor，Georg Ferdinand Ludwig Philip 坎托，乔治 • 

费迪南德 • 路德维格•菲利普 


Cantor, Moritz Benedikt 坎托，莫里茨•本尼迪克特 

Capovani , Milvio 卡波瓦尼，米尔韦欧 

Caramuel Lobkowitz, Juan de 卡拉米尔•洛布科维 

茨，胡安*德 

Cards, playing 扑克牌 

Carissan , Eugene Olivier 卡里桑，尤金•奥利弗 
Carling , Robert Laurenec 卡林，罗伯特•■劳伦斯 
Carlitz, Leonard 卡利茨，伦纳德 
Carmichael, Robert DanieU numbers 卡迈克尔，罗伯 
特 •丹尼 尔数 

Carr,John Weber 卡尔，约翰•韦伯 

Carroll ， Lewis ( = Dodgson , Charles Lutwidge) 卡罗 

尔，刘易斯（ = 道奇森，査尔斯 • 路特威奇） 

Carry 进位： 从较低位传递到当前位的量 
Cassels, John William Scott 卡塞尔斯，约翰 • 威廉 * 斯 

科特 

Casting out nines 舍九法 

Castle,Clive Michael Anthony 卡斯尔，克利弗•迈克 
尔•安东尼 

Catalan , Eugene Charles , numbers 卡塔兰，尤金•査尔 

斯数 

Cauchy ， Augustin Louis 柯西，奥古斯丁 * 路易斯 
inequality 柯西不等式 
matrices 柯西矩阵 

CCITT ： The International Telegraph and Telephone 
Consultative Committee of the ITU (International 
Telecommunication Union) 国际电报电话咨询 

委员会 ：国际 电信联盟的下属机构 
CDC 1604 computer CDC 1604 计算机 
CDC 7600 computer CDC 7600 计算机 

CDROM : Compact disk read-only memory 只读光盘 

存储器 

Ceiling function「il 顶限函数 

Cerlienco ， Luigi 塞利恩科，卢齐 

Certificate of irreducibility 不可约性鉴定 

Certificate of primaiity 素性鉴定 

Cesaro, Ernesto 塞萨罗，欧内斯托 

Ceulen, Ludolph van 塞乌伦，鲁道夫•范 

Chace，Arnold Buffum 蔡斯，阿诺德 • 巴法姆 

Chain multiplications 链乘法 

Chain steps 链步 

Chains of primes 素数链 

Chaitin,Gregory John 蔡廷，格雷戈里 • 约翰 

Chan,Tony FarrCheong 陈繁昌 

Chappie,M. A. 査普尔， M.A. 

CHAR (convert to characters ) 转换成字符指令 
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Characteristic 特征，见 Exponent part 
Characteristic polynomial 特征多项式 
Charles XII of Sweden 瑞典的査尔斯十二世 
Chartres ， Bruce Aylwin 査特里斯，布鲁斯•艾尔文 
Chebotarev, Nikolai Grigorievich ( HeSoTapeB, HHKOJiaH 

rpHmpBeBHM) 契波塔列夫，尼古拉伊•格里戈 
列维奇 

Chebyshev, Pafuntii Lvovich ( IIa(J)HyTHM 

JlbBOBHq) inequality 切比雪夫，帕夫努季•利沃 

维奇不等式 

Cheng,Russell Ch’uan Hsun 郑川训 

Chesterton,Gilbert Keith 切斯特顿，吉尔伯特 •凯思 
Chi-square distribution f 分布 
table y 2 分布表 

Chi-square test 乂 2 检验 

Ch’in ChiirShao 秦九韶 
Chinese mathematics 中国数学 
Chinese remainder algorithm 中国剩余算法 
Chinese remainder theorem 中国剩余定理 
for polynomials 多项式中国剩余定理 
generalized 推广的中国剩余定理 
Chirp transform 齐尔普变换 
Chiu Chang Suan Shu 《九章算术》 

Choice ， random 随机选择 
Chor ， Ben-Zion 科尔，本-蔡恩 

Christiansen,Hanne Delgas 克里斯琴森，汉尼•德尔 
加斯 

Christie Mallowan , Agatha Mary Clarissa Miller 克里 

斯蒂 • 马洛温，阿加萨 • 玛丽 * 克拉里沙•米勒 

Chudnovsky，David Volfovich ( Hyj^HOBCKHH, XUbha 

BoJib(|)OBnq) 丘德诺夫斯基，戴维•沃尔夫科维 
奇 

Chudnovsky, Gregory Volfovich ( HyAHOBCKHft, 

rpHrOpHH BoHb4x)BHH) 丘德诺夫斯基，格里戈 
里•沃尔夫科维奇 

Church , Alonzo 丘奇，阿伦佐 
Cipolla ， Michele 西波拉，米歇尔 
Classical algorithms 经典算法 
Clausen ， Michael Hermann 克劳森，迈克尔•赫尔曼 
Clinger, William Douglas 克林格，威廉•道格拉斯 
CMath : Concrete Mathematics, a book by R. L. Gra¬ 
ham ,D. E. Kunth, and O. Patashnik 《具体的 

数学》 

Cochran, William Gemmell 科克伦，威廉•格默尔 
Cocke,John 科克，约翰 
Codes, linear 线性代码 
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Codes for difficulty of exercises 习题难度代码 
Cody ， William James Jr. 小科迪，威廉•詹姆斯 
Coefficients of a polynomial 多项式系数 
adaptation of 多项式系数的修改 
leading 前导多项式系数 
size of 多项式系数的大小 
Cohen,Daniel Isaac Aryeh 科恩，丹尼尔 • 伊萨克•阿 
里耶 

Cohen ， Henri Jose 科恩，亨利•乔斯 
Cohn,Paul Moritz 科恩，保罗•莫里茨 
Coincidence 巧合 

Colenne, Joseph Desire 科伦，约瑟夫•德席尔 

Coll ins, George Edwin 科林斯，乔治■埃德温 

Collision test 冲突检验 

Color values 颜色值 

Colson John 科尔森，约翰 

Colton » Charles Caleb 科尔顿，查尔斯•凯莱布 

Column addition 列加法 

Combination, random 随机组合 

Combination of random number generators 随机数生 

成程序组合 

Combinations with repetitions 带重复的组合 
Combinatorial matrices 组合矩阵 
Combinatorial number system 组合数系统 
Commutative law 交换律 

Commutative ring with identity 有幺元的交换环 
Comp. J. : The Computer Journal , a publication of the 
British Computer Society since 1958 《计算机杂 

志》 : 英国计算机学会出版的杂志，创刊于 1958 
年 

Compagner , Aaldert 康培纳，阿尔德特 
Companion matrix 伴随矩阵 
Comparison 比较：测试 < ， = 或 > 
continued fractions 连分数比较 
floating point numbers 浮点数比较 
fractions 小数比较 
mixed-radix 混合进制比较 
modular 模数比较 
multiprecision 多精度比较 
Complement notations for numbers 数的辛卜码记法 
Complete binary tree 完备二叉树 
Completely equidistributed sequence 完备等分布序列 
Complex arithmetic 复数算术 
Complex numbers 复数 

representation of 复数的表示 
Complex radices 复数进制 
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Complexity of calculation 计算复杂性 
Composiitkm of power series 蘇级数的组成 
Computability 可计算性 
Concave function 凹函数 
Conditional expression 条件表达式 
Congruential sequence > inversive 逆同余序列 
Congruential sequence,linear 线性同余序列 
choice of increment 线性同余序列增觉的选择 
choice of modulus 线性同余序列模数的选择 
chioce of multiplier 线性同余序列乘数的选择 
choice of seed 线性同余序列种子的选择 
period length 线性同余序列的周期长度 
subsequence of 线性同余序列的子序列 
Congruential sequence , quadratic 二次同余序歹 !j 
Conjugate of a complex number 复数的共辗 
Connection Machine 连接机 
Content of a polynomial 多项式容度 
Context-free grammar 上下文无关文法 
Continuant polynomials 连续多项式 
Continued fractions 连分数 
infinite 无穷连分数 
quadratic irrationalities 二次无理连分数 
regular 正则连分数 

with polynomial quotients 带多项式商的连分数 
Continuous binomial distribution 连续二项分布 
Continuous distribution functions 连续分布函数 
Continuous Poisson distribution 连续泊松分布 
Convergents 收敛式 

Conversion of repressentations 表示的转换，也见 
Radix conversion 
Convex function 凸函数 
Convolution 卷积 
cyclic 循环卷积 
multidimensional 多维卷积 
negacyclic 反循环卷积 
Conway，John Horton 康韦，约翰•霍顿 
Cook, Stephen Arthur 库克，斯蒂芬•阿瑟 
Cooley James William 库利，詹姆斯•威廉 
Coolidge,Julian Lowell 库利奇，朱利安•洛厄尔 
Coonen Jerome Toby 库南，杰罗姆•托比 
Copeland，Arthur Herbert 科普兰，阿瑟•赫伯特 
Coppersmith ， Don 科拍史密斯，唐 
Cormack , Gordon Villy 科马克，戈登•维利 
Coroutine 共行程序 

Corput，Johannes Gualtherus van der 科普特，约翰尼 

斯 • 格尔塞勒斯 • 范•德 


Correlation coefficient 相关系数 
Cosine 余弦 
Cotes , Roger 科茨，罗杰 
Couffignal, Louis 库菲格纳尔，路易斯 
Counting law 计数律 
Coupon collector's test 集券检验 
Couture ， Raymond 库切尔，雷蒙德 
Covariance 协方差 
matrix 协方差矩阵 

Cover，Thomas Merrill 科弗，托马斯•梅里尔 
Coveyou , Robert Reginald 科维佑，罗伯特•雷金纳德 
Cox, Albert George 考克斯，艾伯特•乔治 
Crandall,Richard Eugene 克兰多尔，理査德•尤金 
Craps 双骰子游戏 
Cray T94 computer 克雷 丁 94 计算机 
Cray X-MP computer 克雷 X MP 计算机 
Creative writing 创造性写作 

Crelle ： Journal fur die reine und angewandte Mathe- 
matik f an international journal founded by A. L. 

Crelle in 1826 《克雷勒》 ：即 《科学院统计报 
告》，克雷勒于 1826 年创立的国际性杂志 
Cryptanalysis 密码分析 
Cube root modulo m 模 w 立方根 
Cunningham, Allan Joseph Champneys 坎宁安，阿伦 ■ 

约瑟夫•钱普尼斯 

Cusick,Thomas William 库席克，托马斯•威廉 
Cut-and-riffle 切牌与洗牌 
Cycle in a random permutation 随机排列的周期 
Cycle in a sequence 序列周期 
detection of 序列周期的发现 
Cyclic convolution 循环卷积 
Cyclotomic polynomials 分圆多项式 

Dahl,Ole-Johan 达尔，奥利-约翰 

Daniels, Henry EHis 丹尼尔斯，亨利•艾利斯 

Dase，Johann Martin Zacharias 达斯，约翰•马丁 ■扎 

卡赖亚斯 

Datta ， Bibhutibhusan 戴塔，比布胡底布胡森 
Daude, Herve 多德，赫维 
Davenport ， Harold 达文波特，哈罗德 
David,Florence Nightingale 戴维，弗洛伦斯•南丁格 
尔 

Davis,Chandler 戴维斯，钱德勒 

Davis,Clive Selwyn 戴维斯，克莱夫•塞尔温 

de Bruijnj Nicolaas Govert 德布鲁因，尼克拉斯•戈维 

特 

cycle 德布鲁因循环 
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de Finetti ， Bruno 德芬内蒂，布鲁诺 

de Groote , Hans Friedrich 德格鲁特，汉斯•弗里德里 

克 

de Jong，Lieu we Sytse 德荣，利欧沃•席特思 
de Jonquieres,Jean Philippe Ernest de Fauque 德琼奎 

里斯，琼 • 菲利普 * 欧内斯特•德福基 

de La Vallee Poussin, Charles-Jean-Gustave-Nicolas 德 

拉 • 瓦利 • 波欣，査尔斯 - 琼 - 古斯塔夫-尼古拉斯 
de Lagny,Thomas Fantet 德拉格尼，托马斯•范特特 
Debugging 排错，调试 

Decimal computer 十进计算机：主要处理十进数的 
计箅机 

Decimal digits 十进数字 
Decimal fractions,history 十进小数的历史 
Decimal number system 十进数系统 
Decimal point 小数点 
Decimation 十进表 
Decision , unbiased 无偏倚决策 
DECsystem 20 computer DEC 系统 20 计算机 
Decuple-precision floating point 十倍精度浮点 
Dedekind,Julius Wilhelm Richard 戴德金，朱利亚斯 • 
威廉•理査德 

sums, generalized 戴德金和数，广义戴德金和数 
Definitely greater than 确定地大于 
Definitely less than 确定地小于 
Definition of randomness 随机性定义 
Degot,Jerome 德戈特，杰罗姆 
Degree of a polynomial 多项式次数 
Degrees of freedom 自由度 

Dekker, Theodor us Jozef 德克尔，西奥多罗斯•乔泽 

夫 

Deleglise,Marc 德利格利斯，马克 
Dellac,H. 德拉克 ， H 

DeMitlo,Richard Allan 德米罗，理査德•阿伦 
Denneau , Monty Montague 丹尼欧，蒙蒂•蒙特古 
Denormal floating point number 非正规浮点数 
Density function 密度函数 
nearly linear 近线性密度函数 
Dependent normal deviates 相关正态偏离 
Derandomization 非随机化 
Derflinger , Gerhard 德弗林格，格哈特 
Derivatives 可导的，可微的 
Descartes,Rene 德谢卡特斯，伦尼 
Determinants 行歹 ！ J 式 
Deviate: A random number 随机数的偏离 
Devroye,Lac Piet-Jan Arthur 德弗罗尔，卢克 • 皮特 _ 


简•阿瑟 

Dewey , Melvil , notation for trees 杜威，梅尔维尔的树 
记法 

Diaconis ， Persi Warren 黛亚戈尼斯，拍西•沃伦 
Diamond ， Harold George 戴蒙德，哈罗德•乔治 
Dice 殷子 

Dickman ， Kari Daniel 迪克曼，卡尔•丹尼尔 
Dickman-Golomb constant 迪克曼-戈龙常数 
Dickson ， Leonard Eugene 迪克森，伦纳德•尤金 
Dictionaries 字典 

Dieter, Ulrich Otto 迪特尔，乌尔里克•奥托 

■ 

Differences 差 

Differential equations 差分方程 

Differentiation 微分法，见 Derivatives 

Diffie,Bailey Whitfield 迪菲，贝利•惠特菲尔德 

Digit 数 字：定 位记号下所用 符号； 通常指十进数字 

0 ， 1 ， … ， 9 之一 

binary 二进数字 

decimal 十进数字 

hexadecimal 十六进数字 

octal 八进数字 

Dilcher,Karl Heinrich 迪尔切尔，卡尔•海因里希 

Di logarithm 二重对数 

Diophantine equations 习藩都方程 

Diophantus of Alexandria (Ac6<pavto^ ? AXe^avSp ea>^) 

亚历山大的习藩都，见 Diophantine equations 
Direct product 直接积 
Direct sum 直接和 
conjecture 直接和猜想 
Directed graph 有向图 

Dirichlet,Peter Gustav Lejeune 迪里赫里，彼得•古斯 

塔夫•勒琼 

series 迪里赫里级数 
Discrepancy 差异 

Discrete distribution functions 离散分布函数 
Discrete Fourier transforms 离散傅里叶变换 
Discrete logarithms 离散对数 
Discriminant of a polynomial 多项式的判别式 
Distinct-degree factorization 不同次数的因子分解 
Distribution 分布：支配一个随机变童的值的概率的 
描述 

beta P ( 贝塔）分布 
binomial 二项分布 
chi - square y 2 分布 
exponential 指数分布 

F- F 分布 
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of floating point numbers 浮点数分布 
gamma r ( 伽玛）分布 
geometric 几何分布 
integervalued 整值分布 

Kolmogorov-Smirnov 科尔莫戈罗夫-斯米尔诺夫 

分布， KS 分布 

of leading digits 前导数字的分布 
negative binomial 负的二项分布 
normal 正态分布 

partial quotients of regular continued 

fractions 正则连分数部分商的分布 
Poisson 泊松分布 
of prime factors 素因子分布 
of prime numbers 素数的分布 
Studenr's 学生分布 
卜 t 分布 

tail of binomial 二项分布的尾部 
tail of normal 正态分布的尾部 


uniform 


致分布 


variance-ratio 方差比分布 
edge-shaped 楔形分布 
Distribution functions 分布函数 
continuous 连续分布函数 
discrete 离散分布函数 
empirical 经验分布函数 
mixture of 分布函数的混合 
polynomial 多项式分布函数 
product of 分布函数的积 
Distributive laws 分配律 
Divide-and-correct 除并校正 
Divided differences 除后的差 

Dividend 被除数 
Division 除法 


algebraic numbers 代数数除法 

avoiding 除法的避免 

baJanced ternary 平衡三进制除法 

by ten 除以 10 

by zero 除以 0 

complex 复数除法 

continued fractions 连分数除法 

double-precision 双精度除法 

exact 精确除法 

floating point 浮点除法 

fractions 分数除法 

long 长除法 

mixed-radix 混合进制除法 


mod m 模 w 除法 
multiprecision 多精度除法 

multiprecision by single-precision 通过单精度的多 

精度除法 

polynomial 多项式除法 
power series 幂级数除法 
pseudo - 伪除法 
quater-imaginar 虚 4 除法 
short 短除法 

string polynomials 串多项式除法 
Divisor 除数 

Divisor 因子：若 ： y mod 二 0 且则 x 是 : y 的 
因子；若同时 1<X< ： V, 则是 : y 的真因子 
polynomial 多项式因子 
Dixon, John Douglas 狄克逊，约翰•道格拉斯 
Dixon, Wilfrid Joseph 狄克逊，威尔弗雷德•约瑟夫 
Dobell , Alan Rodney 多贝尔，艾伦•罗德尼 
Dobkin , David Paul 多布金，戴维•保罗 
Dodgson , Charles Lutwidge 道奇森，査尔斯•勒特威 

奇 

Donsker, Monroe David 唐斯克尔，门罗•戴维 
Doob Joseph Leo 杜布，约瑟夫•利奥 
Dorn, William Schroeder 多恩，威廉•施罗德 
Dot product 点积 

Double-precision arithmetic 双精度算术 
Doubling 加倍 

continued fraction 连分数加倍 
Doubting step 倍步 

Downey , Peter James 唐尼，彼得•詹姆斯 

Dragon curve 龙曲线 

Dragon sequence 龙序歹 [J 

Dresden, Arnold 德雷斯登，阿诺德 

Drift 漂移 

Du Shiran 杜石然 

Dual of an addition chain 一^条加法链的对偶 

Duality formula 对偶公式 

Duality principle 对偶原理 

Dubner, Harvey Alien 杜布内，哈维 • 艾伦 

Dumas ， Philippe 杜马斯，菲利普 

Duncan ， Robert Lee 邓肯，罗伯特•李 

Duodecimal number system 十二进制数系统 

Dupre ^ Athanase 杜普雷，阿塔纳西 

Durbin James 德宾，詹姆斯 

Durham , Stephen Daniel 德拉姆，斯蒂芬•丹尼尔 

Durstenfeid, Richard 德斯廷费尔德，理査德 

e 自然对数的底 
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Earle,John Goode! 1 厄尔，约翰 * 古德尔 

Eckhardt ， Roger Charles 艾克哈特，罗杰•查尔斯 

L’ Ecuyer,Pierre 利凯尔，皮埃尔 

Edelman, Alan Stuart 埃德尔曼，艾伦•斯图尔特 

Edinburgh rainfall 爱丁堡的降雨 

EDVAC computer EDVAC 计算机 

Effective algorithms 能行算法 

Effective information 有效信息 

Egyptian mathematics 埃及数学 

Eichenauer-Herrman , Jiirgen 艾克璃尔 - 赫尔曼，朱尔 

金 

Eisenstein , Ferdinand Gotthold Max 艾森斯坦，费迪 

南德 • 戈特溪尔德•马克斯 


Electrologica X8 computer Electrologica X8 计算机 
Electronic mail 电子邮件（函件） 


Elementary symmetric functions 初等对称函数 
Elkies, Noam David 埃尔克斯，诺姆•戴维 
Ellipsoid 椭球面 

random point on 椭球面上的随机点 
Elliptic curve method 稀圆曲线方法 
Empirical distribution functions 经验分布函数 
Empirical tests for randomness 随机性的经验检验 
Encoding a permutation 对排列编码 
Encoding secret messages 对秘密消息编码 
Enflo.Per 恩弗洛，佩尔 

Engineering Research Associates 工程研究协会 
Enhancing randomness 强化随机性 
ENIAC computer ENIAC 计算机 


Entropy 熵 

Enumerating binary trees 枚举二叉树 
Enumerating prime numbers 枚举素数 
Equality > approximate 近似相等 


essential 实质上的相等 


Equidistributed sequence 等分布序列 
Equidistribution test 等分布检验 
Equitable distribution 等分布 
Equivalent addition chains 等价加法链 
Eratosthenes of Cyrene 昔兰尼的厄拉托森斯 
Erdos,Pal ( = Paul) 厄尔多斯，保罗 

ERH 见 Extended Riemann Hypothesis 

ERNIE machine 厄尼计算机 


Error ， absolute 绝对误差 

Error ， relative 相对误差 

Error estimation 误差估计 

Espelid,Terje Oskar 埃斯皮利德，特吉 * 奥斯卡 

Essential equality 实质上的相等 


Estes,Dennis Ray 埃斯特斯，丹尼斯•雷 
Estrin,Gerald 埃斯特林，杰拉尔德 
Euclid ( Kvy\t\8rj6€,) 欧几里得 
Euclid ’ s algorithm 欧几里得算法 
analysis of 欧几里得算法的分析 
compared to binary algorithm 与二进箅法的比较 
extended 扩充欧几里得算法 
for polynomials 多项式的欧几里得算法 
for polynomials , extended 扩充的多项式欧几里得 

算法 

for string polynomials 串多项式的欧几里得算法 
generalized to the hilt 推广到 hilt 的欧几里得算法 
multiprecision 多精度欧几里得算法 
original form 欧几里得算法的原始形式 
Eudoxus of Cnidus 克尼达斯的尤杜古斯 
Euler, Leonhard ( Eftjrepi>, JleoHapA^ - 9njiep, 

JleoHap^) 欧拉，伦哈德 
constant 7 欧拉常数 7 
theorem 欧拉定理 
totient function <p( n ) 欧拉计数函数 
Eulerian numbers 欧拉数 
Evaluation 求值 

of determinants 行列式求值 

of mean and standard deviation 均值与标准差的求 

值 

of monomials 单项式求值 
of polynomials 多项式求值 
of powers 求幂值 
Eve,James 厄维，詹姆斯 
Eventually periodic sequence 最终的周期序列 
Exact division 精确除法 
Excess q exponent 加余量 g 的指数 
Exclusive or 异或 
Exercises ， notes on 关于习题的说明 
Exhaustive search 穷尽查找 
Exponent overflow 指数上溢 

Exponent part of a floating point number 浮点数的指 

数部分 

Exponent underflow 指数下溢 
Exponential deviates,generating 生成指数偏离 
Exponential distribution 指数分布 
Exponential function 指数函数 
Exponential sums 指数和 
Exponentiation 求幕 

multiprecision 多精度求幂 
of polynomials 多项式求幂 
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of power series 幕级数求幕 
Extended arithmetic 扩充算术 
Extended Euclidean algorithm 扩充欧几里得算法 
for polynomials 扩充的多项式欧几里得算法 
Extended Riemann Hypothesis 扩充黎曼假设 

F-distribution F 分布 
Factor 因子 

Factor method of exponentiation 指数的因子方法 
Factorial number system 阶乘数系统 
Factorial powers 阶乘的幕 
Factorials 阶乘 
Factorization 因子分解 
of integers 整数的因子分解 
of polynomials 多项式的因子分解 
of polynomials mod p 多项式模因子分解 
of polynomials over the integers 整数上的多项式 

因子分解 

of polynomials over the rationals 有理数上的多项 

式因子分解 

optimistic estimates of running time 因子分解运行 

时间的最优估计 

uniqueness of 因子分解的惟一性 
FADD (floating add ) 浮点加指令 
Fagin ， Barry Steven 费金，巴里•史蒂文 
Fallacious reasoning 不合理推理 
Falling powers 降幕 
Fan , Chung Teh 范崇德 
Fast Fourier transform 快速傅里叶变换 
history of 快速傅里叶变换的历史 
Fateman, Richard J 费特曼，理查德 • J 
Faure,Henri 福里，亨利 
FCMP (floating compare ) 浮点比较指令 
FDIV (floating divide ) 浮点除指令 
Feijen, WilKelmus ( = Wim) Hendricus Johannes 法伊 

詹，威廉姆斯 （ = 威姆） • 亨德 里卡斯•约翰尼斯 
Ferguson,Donald Fraser 弗格森，唐纳德•弗雷泽 
Fermat ， Pierre de 费马，皮埃尔•德 

factorization method 费马因子分解方法 
numbers 费马数 
theorem 费马定理 

Ferranti Mark I computer 费兰蒂•马克 I 型计算机 
Ferrenberg, Alan Milton 费伦伯格，艾伦•米尔顿 
FFT 见 Fast Fourier transform 

Fibonacci, Leonardo, of Pisa 皮萨的斐波那契，伦纳 

德 

generator 斐波那契生成 


number system 斐波拉契数系统 

numbers F n 斐波那 契数： 斐波那契序列的元素 

numbers, table of 斐波那契数表 

sequence 斐波那契序列 

sequence, lagged 延搁斐波那契序列 

Field 域 ：允行 进行加、减、乘、除的代数系统 
finite 有限域 

Fike, Charles Theodore 菲克，查尔斯•西奥多 
Finck ， Pierre Joseph Etienne 芬克，皮埃尔■约瑟夫 _ 
厄蒂恩 

Finetti ， Bruno de 芬内蒂，布鲁诺•德 

Finite fields 有限域 

Finite Fourier transform 有限傅里叶变换，见 Dis¬ 
crete Fourier transform 
Finite sequences, random 有限随机序列 
Fischer, Michael John 费希尔，迈克尔•约翰 
Fischer ， Patrick Carl 费希尔，帕特里克•卡尔 
Fischlin,Roger 费施林，罗杰 
Fisher, Ronald Aylmer 费希尔，罗纳德•埃尔默 
Fishman , George Samuel 菲什曼，乔泽•塞缪尔 
FIX (convert to fixed point ) 转换到定点指令 
Fix-to-float conversion 定 点-浮 点转换 
Fixed point arithmetic 定点算术 
Fixed slash arithmetic 开缝定点算术 
Flajolet,Philippe Patrick Michel 弗莱乔利特，菲利普 
• 帕特里克•迈克尔 

Flammenkamp , Achim 弗拉门坎普，阿基姆 
Flat distribution 平坦分布，见 Uniform distribution 
Flehinger，Betty Jeanne 弗勒欣格尔，贝蒂•珍妮 
Float-ro-fix conversion 浮点-定点转换 
Floating binary numbers 浮点二进制数 
Floating decimal numbers 浮点十进制数 
Floating hexadecimal numbers 浮点十六进制数 
Floating point arithmetic 浮点算术 
accuracy of 浮点算术的精确性 
addition 浮点加 
addition , exact 精确浮点加 
axioms 浮点算术公理 
comparison 浮点比较 
decuple-precision 十倍精度浮点算术 
division 浮点除法 
double- precision 双精度浮点算术 
hardware 硬件浮点算术 
intervals 区间浮点算术 
mod 浮点取模 
multiplication 浮点乘 
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multiplication, exact 精确浮点乘 
operators of MIX MIX 的浮点操作符 
quadruple-precision 四倍精度浮点算术 
reciprocal 倒数的浮点算术 
single-precision 单精度浮点算术 
subtraction 浮点减 
summation 浮点求和 
triple-precision 三精度浮点算术 
unnormalized 非规格化浮点算术 
Floating point numbers 浮点数 

radix- 6 , excess- ^ b 进 制余量 g 浮点数 
statistical distribution 浮点数统计分布 
two ’ s complement 2 的补码浮点数 
Floating point radix conversion 浮点进制转换 
Floating point trigonometric subroutines 浮点三角子 

程序 

Floating slash arithmetic 开缝浮点算术 ■ 

Floor function 1_ 工」底限函数 
FLOT (convert to floating point ) 转换到浮点指令 
Floyd,Robert W 弗洛伊德，罗伯特 • W 
Fluhrer, Scott 弗卢雷尔，斯科特 
FMUL (floating multiply ) 浮点乘指令 
Foata,Dominique Cyprien 福阿塔，多米尼克•西普里 
恩 

FOCS ： Proceedings of the IEEE Symposia on Founda¬ 
tions of Computer Science ( 1975 — ), formerly 
called the Symposia on Switching Circuit Theory 
and Logic Design ( 1960 — 1965 ), Symposia on 
Switching and Automata Theory (1966 — 1974) 

《 IEEE 计算机科学基础研讨会讨论集》 

Forsythe ， George Elmer 福赛思，乔治•埃尔默 

FORTRAN language FORTRAN 语言 

Fourier,Jean Baptiste Joseph 傅里叶，琼•巴普蒂斯特 

* 约瑟夫 

division method 傅里叶除法 
series 傅里叶级数 
transform , discrete 离散傅里叶变换 
Fractals 碎片 

Fraction overflow 小数上溢 

Fraction part of a floating point number 浮点数的小 

数部分 

distribution of 浮点数小数部分的分布 
Fractions 小数： [0 ， 1 ) 中的数 
conversion 小数的转换 
decimal , history 十进小数的历史 
exponentiation 小数的指数 
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random 随机小数，见 Uniform deviates 
terminating 有穷小数 
Fractions ： Rational numbers 分数:有理数 
Fmenkd ， Aviezri S 弗伦克尔，阿维泽里 -S 
Franel,Jerome 弗兰尼尔，杰罗姆 
Franklin > Joel Nick 富兰克林，乔尔•尼克 
Franta, William Ray 弗兰塔，威廉■雷 
Fredricksen,Harold Marvin 弗雷德里克森，哈罗德 * 
马文 

Free associative algebra 自由结合代数 

Frequency function 频率函数，见 Density function 

Frequency test 频率检验 

Friedland f Paul 弗里德兰，保罗 

Frieze, AJan Michael 弗里兹，艾伦•迈克尔 

Fritz,Kurt von 弗里茨，库尔特•冯 

Frobenius,Ferdinand Georg 弗罗比尼尤斯，费迪南 

德•乔治 

automorphism 弗罗比尼尤斯自同构 
Frye,Roger Edward 弗赖伊，罗杰•爱德华 
FSUB (floating subtract ) 浮点减指令 
Fuchs, Aime 富克斯，艾梅 

Fundamental theorem of arithmetic 算术基本定理 
Fuss,Paul Heinrich von(<I>yc,ndBeji HHKOJideBHH ) 富 

斯，保罗•海因里希 

Gage ， Paul Vincent 盖奇，保罗•文森特 
Ga lam bos, Janos 加拉姆博斯，雅诺什 
Galois ， Evariste 伽罗瓦，埃瓦里斯特 
fields ， 伽罗瓦域，见 Finite fields 
groups 伽罗瓦群 
Gambling systems 赌博系统 
Gamma distribution r ( 伽玛）分布 
Gamma function , incomplete 不完备的 r 函数 
Ganz ,Jurg Werner 甘兹，朱尔格•沃纳 
Gap test 间隔检验 
Gardner, Martin 加德纳，马丁 
Garner, Harvey Louis 加纳，哈维•路易斯 
Gathen,Joachim Paul Rudolf von zur 盖森，乔基姆 - 

保罗 • 鲁 道夫 • 冯•泽 

Gaup ( — Gauss) ， Johann Friedrich Carl ( = Carl 
Friedrich) 髙斯，约翰 • 弗里德里克•卡尔 
lemma about polynomials 高斯多项式引理 
Gaussian integers 高斯整数 
Gay ,John 盖伊，约翰 
gcd ： Greatest common divisor 最大公因寸 1 
Gebhardt, Friedrich 格布哈特，弗里德里克 
Gehrhardt，Karl Immanuel 格哈特，卡尔•伊曼纽尔 
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Geiger » Hans , counter 盖革，汉斯，盖革计数器 
Gei ringer, Hilda , von Mises 盖令格尔，希尔达，冯•迈 

席斯 

Generalized Dedekind sums 广义戴德金和数 

Generalized Riemann hypothesis 广义黎曼假设 

Generating functions 生成函数 

Generation of uniform deviates 一 致偏离的生成 

Genuys, Francois 吉纽斯，弗朗科伊斯 

Geometric distribution 几何分布 

Geometric mean 几何平均 

Geometric series 几何级数 

Gessel, Ira Martin 格塞尔，艾拉•马丁 

Gibb, Allan 吉布，阿伦 

Gilbert, Wiliiam John 吉尔伯特，威廉•约翰 

GUI ， Stanley 吉尔，斯坦利 

GIMPS project GIMPS 工程 

Gioia, Anthony Alfred 乔亚，安东尼•艾尔弗雷德 

Girard, Albert 吉拉德，艾伯特 

Givensjames Wallace Jr. 小吉文斯，詹姆斯•华莱士 

Glaser ， Anton 格拉泽，安东 

Globally nonrandom behavior 全局非随机特性 

Goertzel , Gerald 戈策尔，杰拉尔德 

Goff inet, Daniel 戈芬尼特，丹尼尔 

Goldbach, Christian 哥德巴赫，克里斯琴 

Goldberg, David Marc 戈德堡，戴维•马克 

Golden ratio 黄金比 

Gold reich,Oded 戈德里奇，奥迪德 

Goldschmidt , Robert Elliott 戈德施米特，罗伯特•埃 

利奥特 

Goldstine，Herman Heine 戈德斯坦，赫尔曼•海因 
Goldwasser f Shafrira 戈德瓦泽，沙夫里拉 
Golomb , Solomon Wolf 哥伦布，所罗门 * 沃尔夫 
Golub ， Gene Howard 戈卢布，吉恩•崔华德 
Gonzalez , Teofilo 萨雷斯，特奥菲罗 
Good, Irving John 古德，欧文•约翰 
Goodman , Allan Sheldon 古德曼，阿伦•谢尔登 
Gosper , Ralph William,Jr, 小戈斯珀，拉尔夫•威廉 
Goulard, A. 古拉德 ， A 

Gould ， Henry Wadsworth 古尔德，亨利•沃兹沃思 
Gourdon , Xavier Richard 古尔登，泽维尔•理査德 
GoyaUGirish Kumar 髙耶尔，吉里什 - 库默 
Gradual underflow 逐渐下溢 
Graffe,Carl Heinrich 格拉夫，卡尔*海因里希 
Graham, Ronald Lewis 格雷厄姆，罗纳德•刘易斯 
Gram , Jurgen Pedersen 格拉姆，乔根•佩德森 
Gram-Schmidt orthogonalization process 格拉姆•施密 


特正交化方法 

Granville, Andrew J ames 格兰维尔，安德鲁 •詹 姆斯 
Graph 图 
Graphics 图解 

Gray,Frank,code 格雷，弗兰克码，格雷码 

Gray,Herbert 1L 格雷，赫伯特丄 

gray levels,multiplication of 灰度乘法 

Great Internet Mersenne Prime Search 因特网大梅森 

索数搜索 

Greater than,definitely 确定地大于 
Greatest common divisor 最大公因子 

binary algorithms for 最大公因子二进算法 
Euclidean algorithm for 最大公因子欧几里得算 
法，见 Euclid ’ s algorithm 
multiprecision 多精度最大公因子 
of 72 numbers n 个数的最大公因子 
of polynomials 多项式的最大公因子 
within a unique factorization domain 惟一因子分解 

整环中的最大公因子 

Greatest common right divisor 最大公共右因子 

Greedy algorithm 贪麥算法 

Greek mathematics 希腊数学 

Green，Bert Franklin,Jr. 小格林，伯特•富兰克林 

Greenberger, Martin 格林伯格，马丁 

Greene, Daniel Hill 格林，丹尼尔•希尔 

Greenwood, Joseph Arthur 格林伍德，约瑟夫•阿瑟 

Greenwood , Robert Ewing 格林伍德，罗伯特•尤因 

Gregory , Robert Todd 格里戈里，罗伯特•托德 

GRH 广义黎曼假 设：代 数数的扩充黎曼假设 

Groote,Hans Friedrich de 格鲁特，汉斯•弗里德里克 

德 

Grosswald ， Emil 格罗斯瓦尔德，艾米尔 

Grotefeld , Andreas Friedrich Wilhelm 格罗特菲尔德， 

安德烈亚斯 • 弗里德里克•威廉 

G roups 群 

Galois 伽罗瓦群 

Grube, Andreas 格鲁伯，安德烈亚斯 
Griinwald , Vittorio 格伦沃尔德，维托里奥 
Guaranteed randomness 保证随机性 

Guard digits 保护数字 

Gudenberg 古登伯格，见 Wolff von Gudenberg 
Guessing, amplified 猜测扩大 
Guiloud, Jean 古罗德，琼 

Gustavson ， Fred Gehrung 古斯塔夫森，弗雷德•格龙 
Guy ， Michael John Thirian 盖伊，迈克尔 ■ 约翰 * 瑟里 

安 
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Guy,Richard Kenneth 盖伊，理査德•肯尼思 

Haber ， Seymour 哈伯，西摩 

Habicht, Walter 哈比希特，沃尔特 
Hadamard ， Jacques Salomon 阿达马，雅克•所罗门 
inequality 阿达马不等式 
Hafner,James Lee 哈夫纳，詹姆斯•李 
Hajjar, Mansour 哈加，曼索尔 
HAKMEM MIT AI Laboratory Memo 麻省人工智 
能实验室备忘录 

Ha[berstam ， Heini 哈伯斯塔姆，海尼 
Halewyn , Christopher Neil van 哈勒维，克里斯托弗 • 
内尔•范 

Halliwell-Phillipps,James Orchard 哈利 韦尔 - 菲利普 
斯，詹姆斯•奥査德 

Hal ton , John Henry 霍尔顿，约翰 * 亨利 
Halving 折半 

continued fraction 连分数折半 
modular 模折半 

Hamblin,Charles Leonard 汉布林，査尔斯•伦纳德 
Hamlet, Prince of Denmark 哈姆赖特，丹麦王子 
Hammersley , John Michael 哈默斯利，约翰•迈克尔 
Hamming,Richard Wesley 汉明，理査德•韦斯利 
Handscomb , David Christopher 汉德斯康布，戴维•克 

里斯托弗 

Handy identites 容易得到的恒等式 
Hansen ， Eldon Robert 汉森，埃尔登•罗伯特 
Hansen , Walter 汉森，沃尔特 
Hanson ， Richard Joseph 汉森，理査德•约瑟夫 

Haralambous, Yannis (XapaX a/iitouU, ’ Icoawr^) 哈拉 

拉姆伯斯，扬尼斯 

Hard-core bit 核心位 
Hardware 硬件：计算机线路 

algorithms suitable for 适合于硬件的算法 
Hardy ， Godfrey Harold 哈迪，戈弗雷•哈罗德 
Harmonic numbers H n 调和数 

fractional 分数调和数 
table of 调和数表 
Harmonic probability 调和概率 
Harmonic sums 调和和 

Harmuth , Henning Friedolf 哈姆斯，亨宁•弗里多夫 

Harriot , Thomas 哈里奥特，托马斯 

Harris , Bernard 哈里斯，伯纳德 

Harris, Vincent Crockett 哈里斯，文森特■克罗克特 

Harrison , Charles, Jr. 小哈里森，查尔斯 

Hashing 散列 
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Hassler , Hannes 哈斯勒，汉尼斯 

Hastad, Johan Torkel 哈斯特德，约翰•托克尔 

Haynes,Charles Edmund, Jr. 小海恩斯，査尔斯•埃 

德蒙德 

hcf Highest common factor 最大公因子见 Greatest 
common divisor 

Hebb,Kevin Ralph 赫布，凯文•拉尔夫 
Heideman, Michael Thomas 海德曼，迈克尔 • 托马斯 
Heilbronn, Hans Arnold 海尔布伦，汉斯•阿诺德 
Heindei , Lee Edward 海因德尔，李•爱德华 
Heilman , Martin Edward 赫尔曼，马丁 •爱德华 
Henrici , Peter Karl Eugen 亨利奇，彼得 • 卡尔•尤金 
Hensel,Kurt Wilhelm Sebastian 亨塞尔，库尔特•威 

廉•赛巴斯蒂安 

lemma 亨塞尔引理 

Hensley ， Douglas Austin 亨斯利，道格拉斯*奥斯丁 
Heringa,Jouke Reyn 赫林加，朱克•雷恩 
HermeUnk , Heinrich 赫姆林克，海因里希 
Hermite, Charles 赫米特，査尔斯 
Herrmann , Hans J urgen 赫尔曼，汉斯•朱尔金 
Hershberger John Edward 赫什伯格，约翰•爱德华 
Herzog , Thomas Nelson 赫佐格，托马斯•纳尔逊 
Hexadecimal digits 十六进制数字 
Hexadecimal number system 十六进制数系统 
floating point 浮点十六进制数 
nomenclature for 十六进制数系统的记名法 
Higham , Nicholas John 海厄姆，尼古拉斯 •约翰 
Hilferty，Margaret Mary 希尔费蒂，玛格丽特•玛丽 
Hill, Ian David 希尔，伊恩•戴维 
himult himult 运算 
Hindu mathematics 印度数学 
HITACHI SR2201 computer 日立 SR2201 计算机 
Hitchcock ， Frank Lauren 希契科克，弗兰克•劳伦 
Hlawka , Edmund 赫劳卡，埃德蒙德 
HLT (halt ) 停止指令 
Hobby ， John Dougles 霍比，约翰•杜格尔斯 
Hoffmann, Immanuel Carl Volkmar 霍夫曼，伊曼纽 

尔 • 卡尔•沃尔克默 

Holte,John Myrom 霍尔特，约翰•迈罗姆 
Homogeneous polynomial 齐次多项式 
Hopcroft,John Edward 霍布克洛夫特，约翰•爱德华 
Hormann , Wol fgang 霍尔曼，沃尔夫闪 
Horner ， Horst Helmut 霍纳，霍斯特•赫尔穆特 
Horner, William George 霍纳，威廉•乔治 

rule for polynomial evaluation 多项式计算的霍纳 

规则 
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Horowitz, EUis 游罗威茨，埃利斯 

Howard,John Vernon 趙华德，约翰•弗农 

Howell , Thomas David 豪厄尔，托马斯•戴维 

Hoyle, Edmond , rules 崔尔，埃德蒙德规则 

Huang,Ming-Deh Alfred 黄铭德 

Huff,Darrell Burton 赫夫，达雷尔•伯顿 

Hull , Thomas Edward 赫尔，托马斯•爱德华 

Hurwirz, Adolf 赫尔威茨，阿道夫 

Huygens (二 Huyghens) , Christiaan 体金斯，克里斯琴 

Hyde, John Porter 海德，约翰•波特 

Hyperbolic tangent 双曲正切 

Hyperplanes 超平面 

IBM 704 computer IBM 704 计算机 

IBM 7090 computer IBM 7090 计算机 

IBM System/360 computers, early models IBM Sys- 

tem/360 计灯机的早期模型 
IBM Sysem/360 Model 91 computer IBM System/360 
Model 91 计算机 

IBM System/370 computers IBM System/370 计算机 
I bn Ezra, Abraham ben Meir 伊布恩 • 埃兹拉，亚伯拉 
罕 • 本•梅尔 

, Idem potent 等羅 
Identity element 等兀 

IEEE standard floating point IEEE 标准浮点 
Ikebe, Yasuhibko 池辺八洲彦 
11 [-conditioned matrix 病态矩阵 
Images, digitized 数字化图像 
Imaginary radix 虚数进制 

Impagliazzo,Russell Graham 伊姆佩格利亚佐，拉塞 
尔•格拉姆 

Improving randomness 改进随机性 

IMSL：The International Mathematics and Statistics JLi ， 

brary 国际数学与统计学图书馆 
Inclusion and exclusion principle 容斥原理 
Incomplete gamma function 不完备的 r 函数 
Increment in a linear congruential sequence 线性同余 

序列的增量 

I ndependence ， algebraic 代数独立性 
I ndependence, Li near 线性独立性 
Independence of random numbers 随机数独立性 
Index modulo p 模 p 指数 
Indian mathematics 印度数学 
Induced functions 归纳函数 
Induction ， mathematical 数学归纳法 
on the course of computation 关于计算过程的数学 
归纳法 


Inductive assertions 归纳断言 
Infinite continued fractions 无穷连分数 
Infinity , representation of 无穷的表 ? K 
Inner product 内积 
Integer, random 随机整数 

among all positive integers 所有正整数中的随机整 

数 

in a bounded set 有界集合中的随机整数 
Integer solution to equations 方程的整数解 
Integer-valued distributions 整数值分布 
Integrated circuit module 集成电路模块 
Integration 积分 
Interesting point 有趣点 
Internet 因特网 
Interpolation 内插多项式 
Interpretive routines 解释程序 
Interval arithmetic 区间算术 
Inverse Fourier transform 逆傅里叶变换 
Inverse function 反函数，也见 Reversion of power se¬ 
ries 

Inverse matrix 逆矩阵 
Inverse modulo m 模 m 逆 
Inversive congruential sequence 逆同余序歹 ll 
Irrational number 无理数 

multiples of,mod 1 无理数的模 1 倍数 
transcendental 超越无理数 
Irrational radix 无理数进制 
1 rratbnalky ， quadratic 二次无理性 
Irreducible polynomial 不可约多项式 
Ishibashi , Yoshihiro 石橋善弘 
Islamic mathematics 伊斯兰数学 
Iteration of power series 幂级数的迭代 
Iterative n -source 迭代 w ’ 源 
Iverson,Kenneth Eugene 艾弗森，肯尼思•尤金 

Jabotinsky»Eri 雅博金斯基，埃里 
JACM ： Journal of the ACM, a publication of the Associ¬ 
ation for Computing Machinery since 1954 

《 ACM 杂志》 ：美国 计算机学会的刊物，创刊于 
1954 年 

Jacobi,Carl Gustav Jacob 雅可比，卡尔 • 古斯塔夫•雅 
可比 

symbol 雅可比符号 
JAE (jump A even) A 为偶转移指令 
Jaeschke, Gerhard Paul Werner 贾斯切克，格哈特•保 

■ 

罗•沃纳 

Jager, Hendrik 贾格尔，亨德里克 


•741 • 



索引与词汇表 

Ja’Ja’ ， Joseph Farid 杰杰，约瑟夫‘费里德 

Janssens, Frank 詹森，弗兰克 

Jansson, Briger 詹森，布里格 

JAO (jump A odd) A 奇转移指令 

Japanese mathematics 日本数学 

Jayadeva, Acharya 杰亚德瓦，阿査里亚 

J ebelean ，丁 udor 杰伯利恩，图德 

Jefferson,Thomas 杰斐逊，托马斯 

Jensen, Johan Ludvig Willian Vaidemar 詹森，约翰 • 

路德维格 • 威廉•瓦尔德马 

Jevons, William Stanley 杰文斯，威廉■斯坦利 
Jiuzhsng Suanshu 《九章算术》 

Jobnk,Max Detlev 约翰，马克斯•德特尔夫 

Johnson,Don Herrick 约翰逊，唐•赫里克 

Johnson,Jeremy Russell 约翰逊，杰里米•罗素 

Johnson,Samuel 约翰逊，塞缪尔 

Jokes 乔克斯 

Jones,Hugh 琼斯，休 

Jones,Terence Cordon 琼斯，特伦斯•戈登 

Jong，Lieu we Sytse de 乔恩，利尤韦 • 赛特西•德 

Jonquieres,Jean Philippe Ernest de Fauque de 琼奎里 

斯，琼 • 菲利普 • 欧内斯特 • 德 * 福克■德 
Jordaine,Joshua 乔丹尼，乔舒亚 

Judd,John Stephen 贾德，约翰 * 斯蒂芬 
Jurkat,Wolfgang Bernhard 朱尔卡特，沃尔夫岡.伯 
恩哈德 

Justeson John Stephen 贾斯特森，约翰•斯蒂芬 
JXE (jump X even) X 偶转移指令 
JXO (jump X odd) X 奇转移指令 

会 -distributed sequence k 分布序列 
Kac ， Mark 卡克，马克 
Kahan, William Morton 卡亨，威廉•莫顿 
summation formula 卡亨求和公式 
Kaib, Michael Andreas 凯布，迈克尔•安德烈亚斯 
Kaltofen, Erich Leo 卡尔托芬，埃里克•利奥 
Kaminski ， Michael 卡明斯基，迈克尔 
Kanada , Yasumasa 金田康正 

Kankaala,Kari Veli Ant era 坎加拉，卡里 • 维利 •安特 
罗 

Kannan ， Ravindran 卡南，雷文德兰 

Kanner , Herbert 卡恩纳，赫伯特 

Karatsuba, Anatolii Alekseevich ( Kapauy6a, AHaTOUHH 

AjieKceeBMm) 卡拉特萨巴，阿纳托里•阿历克谢 
维奇 

Karlsuruhe,University of 卡尔苏鲁赫大学 
Kdtai , Imre 卡泰,伊姆里 


Katz, Victor Joseph 卡茨，维克多•约瑟夫 
Keir,Roy Alex 基尔，罗伊•亚历克斯 
Keller, Wilfrid 凯勒，威尔弗里德 
Kempner ， Aubrey John 肯珀，奥伯里 * 约翰 
Kendall,Maurice George 肯德尔，莫里斯•乔治 
Kermack, William Ogilvy 克马克，威廉•奥格尔维 
Kerr,Leslie Robert 克尔，莱斯利•罗伯特 
Kesner ， Oliver 基斯尼尔，奥利弗 

Khinchin, Alexander Yakovlevich ( Xhhmhh , AuexcaHjap 

只 KOBJieBHq) 辛钦，亚历山大•雅科夫列维奇 
Kinderman , Albert John 金德曼，艾伯特■约翰 
Klarner,David Anthony 克拉内尔，戴维•安东尼 
Klem,Laura 克莱姆，劳拉 
Knop,Robert Edward 诺普，罗伯特■爱德华 
Knopfmacher , Arnold 诺普夫梅切，阿诺德 
Knopfmacher » John Peter Louis 诺普夫梅切，约翰 • 
彼得•路易斯 

Knopp，Konrad Hermann Theodor 诺普，康拉德•赫 

尔曼 * 西奥多 

Knorr f Wilbur Richard 诺尔，威尔伯‘理査德 
Knott, Cargill Gilston 诺特，卡吉尔•吉尔斯顿 
Knuth,Donald Ervin 克努特，唐纳德 • 欧文（髙德纳） 
KnuthJennifer Sierra 克努特，詹尼弗 • 西拉（高小 

珍） 

Knuth,John Martin 克努特，约翰 ‘ 马丁（高小强） 
Kohavi ,Zvi 科哈韦，兹维 

Koksma,Jurjen Ferdinand 科克斯马，朱尔珍•费迪南 
德 

Kolmogorov，Andrei Nikolaevich ( KojiMoropoB, AHj^epH 

HKKOJiaeBHw) 科尔莫戈罗夫，安德列•尼古拉耶 
维奇 

Kolmogorov-Smirnov distribution 科尔莫戈罗夫-斯 

米尔诺夫分布 

table 科尔莫戈罗夫-斯米尔诺夫分布表 
Kolmogorov-Smirnov test 科尔莫戈罗夫-斯米尔诺夫 

检验 

Koons ， Florence 库恩斯，弗洛伦斯 
Kornerup , Peter 康纳勒普，彼得 

Korobov, Nikolai Mikhailovich ( Kop6oB, HhKOJ ia h 

MHxaRjroBHq) 科罗波夫，尼古拉•米哈伊洛维 
奇 

Kov6cs ， Bela 科瓦茨，贝拉 

Krai’tchik，Maurice Borisovitch ( Kpaii^HK, Meep 

Bophcobhm) 克莱特奇克，莫里斯•鲍里索维茨 
Krandick ， Werner 克兰迪克，沃纳 
Krishnamurthy , Edayathumangalam Venkataraman 克 
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里斯纳穆尔思，埃达亚苏曼加朗•文卡塔拉曼 

Kronecker ， Leopold 克罗内克，利奥波德 
Kruskal, Martin David 克鲁斯卡尔，马丁 •戴维 
KS test KS 检验，见 Kolmogo rov-Smirnov test 
Kuczma, Marek 库茨马，马雷科 
Kuipers, Lauwerens 凯拍，劳伦斯 
Kulisch, Ulrich Walter Heinz 库利斯，乌尔里克•沃 
尔特■海因茨 

Kung,Hsiang Tsung 孑 L 祥重 
Kurita, Yoshiharu 栗田良春 

Kuttaka 库塔卡 

Kuz ’ min, Rodion Osievich ( Ky 3 ibMHH ， Po^hoh 

OcHeenq) 库兹明，罗迪昂•奥西耶维茨 

/°-chain 

L 3 algorithm JL 3 算法 

La Touche,Maria Price 拉塔奇，玛丽亚 • 普赖斯 
La Vallec Poussin, Charles-Jean-Gustave-Nicolas de 拉 

瓦利 • 波辛，查尔斯 - 琼 - 古斯塔夫 - 尼古拉斯•德 
Laderman Julian David 拉德曼，朱丽安•戴维 

Lafon ,Jean-Ciaude 拉丰，琼-克劳德 
Lagarias.Jeffrey Clark 拉加里亚斯，杰弗里•克拉克 
Lagged Fibonacci sequences 延搁斐波那契序列 
Lagny, Thomas Fantet de 拉格尼，托马斯•范特特 ■ 
德 

Lagrange( = de la Grange),Joseph Louis,Comte 拉格 

朗曰 （ = 德拉 • 格朗日），约瑟夫 • 路易斯•科姆特 

interpolation formula 拉格朗日插值公式 
inversion formula 拉格朗日反演公式 
Lags 延搁 

Lake ， George Thomas 莱克，乔治•托马斯 
Lakshman, Yagati Narayana 拉克斯曼，亚加蒂•纳拉 
亚纳 

Lalanae,Leon Louis Chretien 莱兰尼，利昂 • 路易斯 * 

克里坦 

Lame, Gabriel 拉默，加布里埃尔 

Landau,Edmund Georg Hermann 兰多，埃德蒙德•乔 

治*赫尔曼 

Laplace ( = de la Place), Pierre Simon, Marquts de 拉 

普拉斯，皮埃尔 • 西蒙，马夸斯*德 

Lapko ， Olga Georgievna (JlariKO ， Oji^ra reoprHeBHa) 

拉普科，奥尔加•格奥尔吉维纳 

Large Prime numbers 大素数 

Las Vegas algorithme 拉斯维加斯算法 ：使用 随机数 

的计算方法，若计算终止，则总能产生正确结果 
Lattice of points 点格 

Lattice reduction 格约简，见 Short vectors 


LaughJin,Harry Hamilton 劳克林，哈里•哈密顿 
Laurent, Paul Mathieu Hermann, series 劳伦特，保罗 
• 马休•赫尔曼级数 

Lauwerier,Hendrik Adolf 劳韦里亚，亨德里克•阿道 

夫 

Lavaux, Michel 拉瓦克，米歇尔 

Laving ton, Simon Hugh 拉文顿，西蒙•休 

Lawrence , Frederich William 劳伦斯，弗雷德里克■威 

廉 

Lem：Least common multiple 最小公倍数 

Leading coeffcient 前导系数 

Leading digit 前导数字 

Leading zeros 前导零 

Least common left multiple 最小左公倍数 

Least common multiple 最小公倍数 

Least remainder algorithm 最小剩余算法 

Least signififeant digit 最低有效位 

Lebesgue,Henri Leon, measure 勒贝格，亨利•利昂测 

度 

Lebesgue( = Le Besgue), Victor Amedee 勒贝格，维 
克多•埃米迪 

L^cuyer,Pierre 勒凯耶，皮埃尔 
Leeb ， Hannes 利布，汉尼斯 
Leeuwen,Jan van 纽文，简•范 

Legendre (二 Le Gendre) , Adrien Marie 勒让德，艾德 
里安•玛丽 
symbol 勒让德符号 

Leger, Emile 莱杰，艾米尔 
Leger R . 莱杰 fc R 

Lehman,Russell Sherman 莱曼，拉塞尔■谢尔曼 
Lehmer，Derrick Henry 莱默，德里克•亨利 
Lehmer,Derrick Norman 莱默，德里克•诺曼 
Lehmer,Emma Markovna Trotskaia 莱默，埃玛•马尔 
科夫纳 * 特罗斯卡亚 
Lehn Jurgen 莱恩•朱尔金 

Leibniz, Gottfried Wilhelm, Freiherr von 莱布尼茨， 

戈特弗里德 • 威廉，弗雷赫尔•冯 
Lem pel, Abraham 伦拍尔，亚伯拉罕 
Lenstra, Arjen Klaas 伦斯特拉，阿金•克拉斯 
Lenstra,Hendrik Willem, Jr. 小伦斯特拉，亨德里克 
•威廉 

Leonardo Pisano 伦纳多 • 比萨诺，见 Fibonacci 
Leong, Benton Lau 利昂，本顿 • 劳 （梁捷安） 

Leslie,John 莱斯利，约翰 
Less than , definitely 确定地小于 
Levene , Howard 莱文，權华德 


• 743 


索引与词汇表 


LeVeque, William Judson 莱维格，威廉•贾德森 
Levin, Leonid Anatolievich ( JIgemh, JleHH^ 

AHaTOJTbeBHq) 莱文，利奥尼德•阿纳托里耶维 
奇 

Levine,Eugene 莱文，尤金 
Levy , Paul 莱维，保罗 

Levy , Silvio Vieira Ferreira 莱维，西尔维奥 • 维拉•费 

雷拉 

Lewis John Gregg 刘易斯，约翰•格雷格 

Lewis,Peter Adrian Walter 刘易斯，彼得 * 艾德里安 * 

沃尔特 

Lewis,Theodore Gyle 刘易斯，西奥多•盖尔 
Lexicographic order 字典序 
li : Logarithmic integral function 对数整数函数 
Li, Ming 李明 
Li Yan 李俨 

Lickteig,Thomas Michael 利克特格，托马斯•迈克尔 
Lindhom,James H 林霍姆，詹姆斯 
Linear congruential sequene 线性同余序列 

choice of increment 线性同余序列增量的选择 
choice of modulus 线性同余序列模数的选择 
choice of multiplier 线性同余序列乘数的选择 
choice of seed 线性同余序列种子的选择 
period length 线性同余序列的周期长度 
subsequence of 线性同余序列的子序列 
Linear equations 线性方程组 

integer solution to 线性方程组的整数解 
Linear factors mod p 模 p 线性因子 
Linear iterative array 线性迭代数值 
Linear lists 线性表 
Linear operators 线性算子 
Linear probing 线性探查 
Linear recurrences 线性递归（推） 

mod ^ 模 m 线性递归（推） 

Linearly independent vectors 线性无关向童 

Linked memory 链接存储 

Linking automaton 链接自动机 

Lirmainmaa,Seppo Ilmart 林南马，塞普波•伊尔马里 

Liouville Joseph 莱奥维尔，约瑟夫 

Lipton,Richard Jay 利普顿，理查德•杰伊 

Liquid measure 液量单位 

Little Fermat computer 小费马计算机 

Littlewood,John Edensor 利特尔伍德，约翰•伊登索 

尔 

LLL algorithm LLL 算法 
Local arithmetic 局部箅术 
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Locally nonrandom behavior 局部非随机性 
Loewenthal , Dan 洛温特尔，唐 
Logarithm 对数 
discrete 离散对数 
of a matrix 矩阵的对数 
of a power series 幕级数的对数 
of a uniform deviate —致偏离的对数 
of 今的对数 

Logarithmic integral 对数积分 

Logarithmic law of leading digits 前导数字的对数律 

Logarithmic sums 对数和 

Logical operations 逻辑运算，见 Boolean operations 
Loh, Gunter 洛，同特 
lomult lomuit 函数 
Long division 长除法 

Loos,Rudiger Georg Konrad 卢斯，鲁迪格 • 乔治•康 

拉德 

Lotti, Grazia 洛蒂，格拉齐亚 

Lovasz , Laszio 洛瓦兹，拉兹罗 

Lovelace , Augusta Ada Byron King 洛夫莱斯，奥古斯 

塔 • 艾达 • 拜伦•金 

Countess of 洛夫莱斯伯爵夫人 
Loveland t Donald William 洛夫兰，唐纳德•威廉 
Lubiw, Anna 卢比，安娜 
Lubkin,Samuel 卢布金，塞缪尔 
Luby ， Michael George 卢比，迈克尔•乔治 
Lucas, Francois Edouard Anatole 卢卡斯，弗朗科伊 

斯 • 埃杜瓦德♦阿纳托尔 

numbers L 1{ 卢卡斯数 

Lukes,Richard Francis 卢克斯，理査德♦弗朗西斯 

Llischer,Martin 勒斯切，马丁 

Luther,Herber Adesla 卢瑟，赫伯•艾德斯拉 

m -ary method of exponention 指数的 m 进方法 
Ma ， Keju 马柯驹 

machine language versus higher-level languages 机器 

语言与高级语言 

MacLaren ， Malcolm Donald 麦克拉伦，马尔科姆•唐 

纳德 

Mac Mahon P Percy Alexander 麦克马洪，拍西•亚历 

山大 

MacMillan,Donald 麦克米伦，唐纳德 -B 
MacPherson, Robert Duncan 麦克弗斯，罗伯特 •邓肯 
MacSorley , Olin Lowe 麦克索利，奥林•洛 
Maeder, Roman Erich 梅德，罗曼 * 艾里奇 
Mahler, Kurt 马勒，库尔特 
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measure 马勒测度 

Makarov, Oleg Mikhailovich ( MaKapoB ， Oner 

MnxaHJiOBHM) 马卡罗夫，奥列格•米哈伊洛维 
奇 

Mallows，CoHn Lingwood 马洛斯，科林•林格伍德 
Manasse, Mark Steven 马纳西，马克•史蒂文 
Manchester University Computer 曼彻斯特大学计算 
机 

Mandelbrot , Benoit Baruch 曼德尔伯洛特，贝诺瓦 * 

巴鲁克 

Mangoldt , Hans Carl Friedrich von 曼戈尔德，汉斯 • 
卡尔 • 弗里德里克*冯 
function 曼戈尔德函数 
MANIAC III computer MANIAC III 计算机 
Mansour f Yishay 曼苏尔，易沙 
ManteUWiHem 曼特尔，威廉 
Mantissa 尾数，见 Fraction part 

Marczynski ， Romuald Wladyslaw 马金斯基，罗米尔 

德 ■伍拉 迪斯罗 

iMariage, Aime 玛丽亚格，艾梅 

Mark I computer (Ferranti) Mark I 计算机（费伦蒂） 

Mark II Calculator (Harvard) Mark II 计算器（哈佛） 

Marsaglia, George 马萨格里亚，乔治 

Martin > Monroe Hamish 马 丁 > 门罗•哈尼什 

Martin-Lof,Per Erik Rutger 马丁 - 洛夫，佩尔•埃里 

克•拉特格 
Masking 屏蔽 

Math. Comp：Mathematics of Computation (1960 _ ), a 
publication of the American Mathematical Society 
since 1965; founded by the National Research 
Council of the National Academy of Sciences under 
the original title Mathematicsl Tables and Other 

Aids to Computation ( 1943 — 1959 ) 《计算数 

学》 ：美国 数学协会出版的杂志 
Mathematical aesthetics 数学美学 
Matias, Yossi 马蒂亚斯，约斯 
Matrix 矩阵 

characteristic polynomial 矩阵的特征多项式 
determinant 矩阵的行列式 

greatest common right divisor 矩阵的最大公共右 
因子 

inverse 逆矩阵 
multiplication 矩阵乘法 
null space 零空间矩阵 
permanent 矩阵的积和式 
rank 矩阵的秩 


semidefinite 半确定的矩阵 
singular 奇异矩阵 
triangularization 矩阵的三角化 
Matrix(Bush) , Irving Joshua 马特里克（布什 ） ，欧文 
■乔舒亚 

Matsumoto , Makoto 松本真 

Matthew ， Saint 马修，圣 

Matula,David William 马图拉，戴维•威廉 

Mauchlyjohn William 奠奇利，约翰•威廉 

Maximum of random deviates 随机偏离的极大值 

Maximum-of-i test t 的极大值检验 

Maya Indians 玛雅印第安人 

Mayer,Dieter Heinz J6rg 迈耶，迪特尔 • 海因茨•乔格 
McCarthy , Daniel Patrick 麦卡锡，丹尼尔•帕特里克 
McClellan f Michael Terence 麦克莱伦，迈克尔•特伦 

斯 

McCracken ， Daniel Delbert 麦克拉肯，丹尼尔•德尔 
伯特 

McCurley, Kevin Snow 麦克利，凯文•斯诺 
McEjiece,Robert James 麦克利斯，罗伯特•詹姆斯 
McKendrick, Anderson Gray 麦肯德里克，安德森‘格 

雷 

Mean > evaluation of 均值计算 
Measure,units of 测度单位 
Measure theory 测度论 
Mediant rounding 中间舍入 

Meissel,Daniel Friedrich Ernst 迈塞尔 • 丹尼尔•弗雷 
德里克*厄恩斯特 

Mellin ， Robert Hjalmar , transforms 梅伦，罗伯特■亚 

尔马变换 

Mendelsohn, Nathan Saul 门德尔松，内森•索尔 
Mendes France, Michel 门德兹 • 弗朗斯，迈克尔 
Mental arithmetic 智力算术 
Merit , figure of 品值指标 
Mersenne, Marin 梅森，马林 
multiplication 梅森乘法 
numbers 梅森数 
primes 梅森素数 

Mertens Fran 2 Carl Joseph 默顿斯 • 弗朗兹 • 卡尔■约 

瑟夫 

constant 默顿斯常数 
METAFONT METAF0NT 语言 
METAPOST METAP0ST 语言 
Metrology 计量学，计量衡制 

Metropolis,Nicolas Constantine 梅特罗波利斯，尼古 
拉斯•康斯坦丁 
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Metze ， Gernot 梅茨，杰诺特 

Meyer, Albert Ronald da Silva 迈耶，艾伯特 • 罗纳德 . 
达*席尔瓦 

Micaii , Silvio 迈克利，席尔瓦 
Michigan > University of 密执安大学 
Middle-square method 平方取中法 
Midpoint 中点 

M lg notte, Maurice 米格诺特，莫里斯 
Mikamt , Yoshio 三上义夫 
Mikusihski Jaa 米库辛斯基•简 
Miller,Gary Lee 米勒，加里•李 
Miller,James M 米勒，詹姆斯 

Miller，Jeffrey Charles Percy 米勒，杰弗里 • 查尔斯 • 
珀西 

Miller ， Kenneth William 米勒，肯尼思•威廉 
Miller, Victor Saul 米勒，维克多•索尔 
Miller, Webb Colby 米勒，韦布•科尔比 
Milne-Thompson , Louis Melville 米尔恩 - 汤姆森，路 
易斯•梅尔维尔 

Minimizing a quadratic form 极小化一个二次型 
Minimum polynomial 极小多项式 
Minkowski , Hermann 明柯维斯基，赫尔曼 
Minus zero 负零 
MIP-years M1P 年 

Miranker,Willard Lee 米朗克，威拉德•李 
Mises,Richard ， Edler von 迈西泽，理査德，艾德勒 • 
冯 

Mitchell,Gerard Joseph Francis Xavter 米切尔，杰拉 

德 • 约瑟夫 * 弗朗西斯•泽维尔 

MIX computer MIX 计算机 

binary version MIX 计算机的二进形式 
floating point attachment MIX 计算机的浮点附件 
Mixed congruential method 混合同余方法，见 Linear 
congruential sequence 

Mixed-radix number systems 混合进制数系统 
addition and subtraction 混合进制数的加减法 
balanced 平混的混合进制数系统 
comparison 混合进制数的比较 
counting by Is 以1计数的混合进制数 
multiplication and division 混合进制数的乘除法 
radix conversion 混合进制数的进制转换 
Mixture of distribution functions 分布函数的混合 
Mobius，August Ferdinand, function 莫比尤斯，奥古 

斯特•费迪南德函数 

inversion formula 莫比尤斯反演公式 
mod 取模 

• 746 • 


mod m arithmetic 模⑺算术 
addition 模 w 加法 
division 模 m 除法 
halving 模 m 折半 
multiplication 模 w 乘法 

on polynomial coefficients 多项式系数的模 w 算 

术 

square root 模 w 平方根 
subtraction 模 m 减法 
Model V computer Model V 计辟机 
Modular airthmetic 模算术，同余算术 
complex 复数的模算术 

Modular method for polynomial gcd 多项式最大公因 
子的模方法 

Modulus in a linear congruential sequence 线性同余序 
列中的模数 

Moench ， Robert Thomas 芒克，罗伯特 * 托马斯 
Metier,Ole 莫勒，奥利 

Monahan,John Francis 莫纳汉，约翰•弗朗西斯 

Monic polynomial 首一多项式 

Monier,Louis Marcel Gino 莫尼尔，路易斯 • 马塞尔 - 

吉诺 

Monkey tests 猴子检验 
Monomials,evaluation of 首一多项式的求值 
Monotonicity 单调性 
Monre Carlo 蒙特卡罗 

Monte Carlo method 蒙特卡罗方法：任何使用随机 

数的计箅方法（可能不产正确答案），也见 Us 
Vegas algorithms , Randomized algorithms 
Montgomery ， Hugh Lowell 蒙哥马利，休•洛厄尔 
Montgomery ， Peter Lawrence 蒙哥马利，彼得•劳伦 

斯 

multiplication mod m 蒙哥马利模 m 乘法 
Moore ， Donald Philip 穆尔，唐纳德•菲利普 
Moore ， Louis Robert 穆尔，路易斯•罗伯特 
Moore，Ramon Edgar 穆尔，拉蒙•埃德加 
Moore School of Electrical Engineering 穆尔电气工程 
学校 

Morain,Francois 莫兰，弗朗科伊斯 
Morgenstern ， Jacques 摩根斯坦，雅克 
Morley ， Geoffrey Hugh 莫利，杰弗里 •休 
Morris,Robert 莫里斯，罗伯特 
Morrsion ， Michael AJlan 莫里森，迈克尔•阿伦 
Morse , Harrison Reed 莫尔斯，哈里森■里德 
Morse，Samuel Finley Breese, code 莫尔斯，塞缪尔 • 
芬利•布里斯代码 
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Moses,Joel 摩西，乔尔 
Most significant digit 最高有 效数字 
Motzkin,Theodor Samuel 莫茨金，西奥多•塞缪尔 
Muddle-square method 混合平方方法 
Muller,Mervin Edgar 马勒，默文•埃德加 
Multinomial coeffcients 多项式系数 
Multinomial theorem 多项式定理 
Multiple-prectsion arithmetic 多精度算术 

addition 多精度加法 

comparison 多精度比较 
division 多精度除法 

greatest common divisor 多精度最大公因子 
multiplication 多精度乘法 
radix conversion 多精度进制转换 
subt raction 多精度减法 
table of constants 多精度常数表 
Multiples 倍数 

Multiples of an irrational number mod 1 无理数的模 1 

倍数 

Multiplication 乘法 
complex 复数乘法 
double-precision 双精度乘法 
fast ( asymptotically) ( 渐近地）快速乘法 
floating point 浮点乘法 
fractions 小数乘法 
matrix 矩阵乘法 
Mersenne 梅森乘法 
mixed-radix 混合进制乘法 
mod m 模乘法 
mod 模 w(j ：) 乘法 

modular 模数乘法 
multiprecision 多精度乘法 

multiprecision by single-precision 通过单精度的多 

精度乘法 

polynomial 多项式乘法 
power series 蒂级数乘法 
Multiplicative congruential method 乘同余法 
Multiplier in a linear congruential sequence 线性同余 

序列中的乘数 

Multiply-and-add algorithm 乘和加算法 
Multiprecision 多精度：任意精度 
Multisets 多重集合 
operations on 多重集合的运算 
terminological discussion 多重集合术语讨论 
Multivariate polynomials 多变量多项式 
chains 多变量多项式链 


factors 多变 M 多项式的因子 
noncommutative 非交换的多变童多项式 
roots of 多变虽多项式的根 
Munro, James Ian 芒罗，詹姆斯•伊恩 
Musical notation 音乐记号 

Musinski Jean Elisabeth Abramson 穆辛斯基，琼•伊 

丽莎白 * 艾布拉姆森 
Musser,David Rea 马瑟，戴维•雷亚 

N-source A/ 源 
Nadler, Morton 纳德勒，莫顿 
Nance, Richard Earle 南斯，理査德•厄尔 
Nandi,Salil Kumar 南迪，萨利尔*孔默 
NaNs 无穷、无定义或不寻常的量 
Napier,John,Laird of Merchiston 内皮尔，约翰，马其 
顿领主 

Native American mathematics 美国数学 
Needham,Joseph 尼达姆，约瑟夫 
Negabinary number system 负二进数系统 
Negacyclic convolution 负循环卷积 
Negadecimal number system 负十进数系统 
Negative binomial distribution 负二项分布 
Negative digits 负数字 

Negative numbers,representation of 负数的表示 
Negative radices 负进制 

Neighborhood of a floating point number —个浮点数 

的领域 

Neugebauer^Otto Eduard 诺伊格鲍尔，奥托•埃杜瓦 
德 

Neumann John von ( = Margittai Neumann Jdnos 诺 

伊曼，约翰 • 冯 （ = 马吉塔 • 诺伊曼 • 雅诺什） 

Newcomb , Simon 纽科姆，西蒙 

Newman ， Donald Joseph 纽曼，唐纳德•约瑟夫 

Newton ， Isaac 牛顿，艾萨克 

interpolation formula 牛顿内插公式 
method for rootfinding 牛顿求根法 
Ni,Wen-Chun 倪文君 
Nicomachus of Gerasa 杰拉萨的尼科马彻斯 
Niederreiter, Harald Gunther 尼德尔雷特，哈拉德 . 
冈瑟 

Nijenhuis, Albert 尼詹惠斯，艾伯特 
Nine Chapters on Arithmetic 《九章算术》 

Nines,casting out 舍九法 

Nines' complement notation 九的补码记法 

Nisan ， Noam 尼桑，诺姆 

Niven, Ivan Morton 尼文，伊凡•莫顿 

Nonary (radix 9) number system 九进制数系统 
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Noncommutative multiplication __可交换乘法 
Nonconstructive proofs 非结构化证明 

Nonnegative 非负的 

Nonsingular matrix 非奇异矩阵：具有非零行列式值 
的矩阵 

Norm of a polynomial 多项式的范数 
Normal deviates 正态偏离：具有正态分布的随机数 
dependent 相关正态偏离 
direct generation 正态偏离的直接生成 
square of 正态偏离的平方 
Normal distribution 正态分布 
tail of 正态分布的尾部 
variations 正态分布变形 
Normal evaluation schemes 正常计算方案 
Normal numbers 正规数 
Normalization of divisors 除数的规格化 
Normalization of floating point numbers 浮点数的规 
格化 

Normand, Jean-Marie 诺曼德，琼-玛丽 
Norton，Graham Hilton 诺顿，格拉姆•希尔顿 
Norton , Karl Kenneth 诺顿，卡尔•肯尼思 
Norton , Victor Thance , Jr. 小诺顿，维克多 - 塞恩斯 
Notations t index to 符号索弓 I 
Nozaki ， Aklhiro 野山奇昭弘 
NP 〜 complete problems NP 完全问题 
Null space of a matrix 矩阵的零空间 
Number field sieve 数域筛 
Number fields 数域 
Number sentences 数的句子 
Number system 数系统：用于表示数的语言 
balanced binary 平衡二进制数系统 
balanced decimal 平衡的十进制数系统 
balanced mixed-radix 平衡的混合进制数系统 
balanced ternary 平衡的三进制数系统 
binary (radix 2 ) 二进制数系统 
combinatorial 组合数系统 
complex 复数系统 

decimal (= denary ， radix ten ) 十进制数系统 

duodecimal (radix tewlve ) 十二进制数系统 

factorial 阶乘数系统 

Fibonacci 斐波那契数系统 

floating point 浮点数系统 

hexadecimal (radix sixteen ) 十六进制数系统 

mixed-radix 混合进制数系统 

modular 模数系统 

negabinary (radix-2 ) 负二进制数系统 
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negadecimal 负十进制数系统 
nonary (radix 9 ) 九进制数系统 

場 

octal( = octonary = octonal, radix 8 ) 八进制数系统 

p-s6\c p-adic 数系统 
phi cp 数系统 
postitional 定位计数系统 
primitive tribal 本原族数系统 
quater-imaginary(radix 2i ) 虚四数系统 
quaternary (radix 4 ) 四进制数系统 
quinary (radix 5 ) 五进制数系统 
rational 有理数系统 

regular continued fraction 正则连分数系统 
reversing binary 反序二进数系统 
revolving binary 旋转二进数系统 
sedecimal ( = hexadecimal ) 十六进制数系统 
senary (radix 6 ) 六进制数系统 
senidenary ( — hexadecimal ) 十六进制数系统 
septenary (radix 7 ) 七进制数系统 
sexagesimal ( radix sixty ) 六十进制数系统 
slash 开缝数系统 
ternary (radix 3 ) 三进制数系统 
vigesimal (radix twenty ) 二十进制数系统 
Numerical instability 数值不稳定性 
Nunes ( = Nunez Salaciense = Nonius) 

Pedro 努涅斯•佩德罗 
Nussbaumer，Henri Jean 努斯鲍默，亨利•琼 

Octal (radix 8) number system 八进制数系统 
Octavation A 进制转换 
Odd-even method 奇偶方法 

Odlyzko, Andrew Michael 奥德里兹科，安德魯•迈克 

尔 

DFLO DFLO 子程序 

Oldham, Jeffrey David 奥尔德姆，杰弗里•戴维 

Oliver ， Ariadne 奥利弗，阿里亚德内 

Olivos Aravena , Jorge August。Octavio 奥利沃斯•阿 

拉维纳，乔治 • 奥古斯托•奥克塔维欧 

One-way function 单向函数 

Ones’complement notation 1 的补码记法 

Online algorithms 在线算法 

Operands 操作数：运箅中的呈，例如，在计算 w + v 

时的 W 和！； 

Ophelia,daughter of Polonius 奥菲利疵，波洛尼亚斯 

之女 

Optimum methods of computation 计算的最优方法， 

见 Complexity 
OR (bitwise or ) 或 
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Order of a modulo m < 2 的模 w 阶 

Order of an element in a field 一 个域中元素的阶 

Order of magnitude zero 童 0 的阶 

Ordered hash table 有序散列表 

Oriented binary tree 有向二叉树 

Oriented tree 有向树 

Ostrowski, Alexander Markus 奥斯特罗斯基，亚历山 
大•马卡斯 

Oughtred,W,lliam 奥特莱德，威廉 

Overflow 上溢出 
exponent 指数上溢 
fraction 小数上溢 
rounding 舍人上溢 

Overstreet,Claude Lee ， Jr. 小奥弗斯特里特，克劳德 

•李 

Owen,John 欧文，约翰 

Owings, James Claggettjr. 小奥因斯，詹姆斯 • 克拉 

杰特 

Ozawa, Kazufumi 小泽一文 

/>-adic numbers p-adic 数 
packing 打包，组装 
Pad 纟 ， Henri Eugene 帕德，亨利 •尤金 
Padags Andris 帕德格斯•安德里斯 
Pairwise independence 对偶独立 
Palindromes 回文 

Palmer, John Franklin 帕尔默，约翰■富兰克林 
Pan, Victor Yakovlevich (IlaH, BHKTOP HKOBjieBHq) 

潘，维克托•雅科夫列维茨 

Panario Rodriguez, Daniel Nelson 帕纳里奥■罗德里 

格茨，丹尼尔•纳尔逊 

Pandu Rangan，Chandrasekaran 潘都 • 兰根，钱德雷 

斯卡兰 

Papadimitriou , Christos Harilaos 帕帕迪米特里欧，克 

里斯托斯•哈里劳斯 

Pappus of Alexandria 亚历山德里亚的帕帕斯 
Paradox 悖论 

Parallel computation 并行计算 

Parameter multiplications 参数乘法 

Parameter step 参数步 

Pardo 帕多，见 丁 rabb Pardo 

Park, Stephen Kent 帕克，史蒂芬•肯特 

Parlett,Beresford Neill 帕利特，贝雷斯弗德.尼尔 

Parry,William 帕里，威廉 

Partial derivatives 部分偏离 

Partial fraction expansion 部分小数展开 

Partial ordering 偏序 


Paritial quotients 部分商 

distribution of 部分商的分布 
Partition test 分划检验 
Partitions of a set 集合的分划 
Partitions of an integer 整数的分划 
Pascal,Blaise 帕斯卡，布莱斯 
Pascal-SC language Pascal-SC 语言 
Patashnik,Oren 帕特什尼克，奥伦 
Paterson ， Michael Stewart 佩特森，迈克尔•斯图尔特 
Patience 耐心，忍耐力 

Patterson,Cameron Douglas 佩特森，卡梅伦 * 道格拉 

斯 

Paul,Nicholas John 保罗，尼古拉斯•约翰 
Pawlak, Zdzislaw 波拉克，泽德吉斯洛 
Payne, William Harris 佩恩，威廉•哈里斯 
Paz ， Azaria 帕兹，阿扎里亚 
Peano,Giuseppe, 皮亚诺，吉乌塞普 
Pearson ， Karl 皮尔逊，卡尔 

Perice,Charles Santiago Sanders 佩里斯，查尔斯•圣 
地亚哥•桑德斯 

Penk , Michael Alexander 彭克，迈克尔•亚历山大 
Penney，Walter Francis 彭尼，沃尔特•弗朗西斯 
Pentium computer chip 奔腾计算机芯片 
Percentage points 百分比点 
Perfect numbers 完全数 
Perfect squares 完全平方 
Period in a sequence 序列的周期 
length of 序列的周期长度 
Periodic continued fraction 周期连分数 
Permanent 积和式 

Permutation 排列：一个集合的有序安排 
mapped to integers 整数映像的排列 
random 随机排列 
Permutation test 排列检验 
Perron ， Oskar 佩龙，奥斯卡 
Persian mathematics 波斯数学 

Pervushin, Ivan Mikheevich ( riepByLUHH, Hb8 H 

MHxeeBHM) 佩武欣，伊凡•迈克希维茨 
Petho, Attila 佩托，艾蒂拉 

Petkovsek,Marko 佩特科夫塞克，马可 
Petr, Karel 佩特，卡莱尔 
Pfeiffer,John Edward 法伊弗，约翰•爱德华 
Phalen ， Harold Romaine 费伦，哈罗德•罗曼 
Phi 今 

Phillips, Ernest William 菲利普斯，欧内斯特•威廉 

Pi 7T 
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Picutti,Ettore 皮丘蒂，埃托尔 
pigeonhole principle 鹤巢原理 
Pirtgala, Acharya 平加拉，阿卡里亚 
Pipeline 管道 

Pippenger, Nicholas John 皮彭格尔，尼古拉斯•约翰 

Piras,Francesco 皮雷斯，弗朗西斯科 

Pitfalls of random number generation 随机数生成的 

缺陷 

Pitteway, Michael Lloyd Victor 皮特威，迈克尔 * 劳埃 

德•维克多 
Places 位置 

Planck,Max Karl Ernst Ludwig, constant 普朗克，马 

克斯 • 卡尔 • 厄恩斯特 • 路德维格常数，普朗克常 

数 

Plauger.PhiJJip James 普罗杰，菲利普•詹姆斯 
Play writing 剧本创作 
Plouffe,Simon 普劳夫，西蒙 
PM system PM 系统 

Pocklington , Henry Cabourn 波克林顿，亨里.卡博恩 

Pointer machine 指针机器 

Poirot ， Hercule 波伊罗特，赫尔克利 

Poisson,Simeon Denis, distribution 泊松，西蒙•丹尼 

斯分布 

Poker test 扑克检验 
Polar coordinates 极坐标 
Polar method 配极方法 
Pollard,John Michael 波拉德，约翰■迈克尔 
Polya,GyOrgy ( = George) 波利亚，乔治 
polynomial 多项式 
addition 多项式加法 
arithmetic modulo m 模 m 多项式算术 
degree of 多项式的次数 
derivative of 多项式的导数 
discriminant of 多项式的判别式 
distribution function 多项式的分布函数 
division 多项式除法 
evaluation 多项式的计算 
factorization 多项式的因子分解 
greatest common divisor 多项式的最大公因子 
interpolation 多项式插值 
irreducible 不可约多项式 
leading coeffcient 多项式的前导系数 
monic 首 一 多项式 
multiplication 多项式乘法 
multivariate 多变量多项式 
norms 多项式范数 
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over a field 一个城上的多项式 

over a unique factorization domain —个惟一因子分 

解整环上的多项式 
primitive 本原多项式 
primitive modulo p 模 p 本原多项式 
primitive part 多项式的本原部分 
random 随机多项式 
remainder sequence 剩余序列多项式 
resultant 冗余多项式 
reverse of 多项式的逆 
roots of 多项式的根 
sparse 稀疏多项式 
squarefree 无平方多项式 
string 串多项式 
subtraction 多项式减法 
Polynomial chains 多项式链 
Pomerance , Carl 波默兰斯，卡尔 
Poorten , Alfred Jacobus van der 普尔顿，艾尔弗雷德 

• 雅各布斯 • 范-德 

Pope, Alexander 波普，亚历山大 

Pope ， David Alexander 波普，戴维•亚历山大 

Popper ， Karl Raimund 波拍，卡尔•雷蒙德 

Portable random number generators 可移植的随机数 

生成程序 

Porter, John William 波特，约翰•威廉 

Positional representation of numbers 数的定位表示法 

Positive definite quadratic form 正定二次型 

Positive opera tor 正算子 

Positive semidefinite matrix 半正定矩阵 

Potency 效能 

Power matrix 释矩阵 

Power series 幕级数，见 Generating functions 

manipulation of 释级数的操作 
Power tree 屏树 
Poweroids 似次幕 
Powers ， Don M. 鲍尔斯，唐 
Powers,evaluation of 羅的计算 
multiprectsion 多精度的幂计算 
polynomial 多项式蒂计算 
power series 幂级数幂计算 
Powers，Ralph Earnest 鲍尔斯，拉尔夫•厄内斯特 
pp ： Primitive part 本原部分 
Pr ： Probability 概率 

Pratt ， Vaughan Ronald 普拉特，沃恩 * 罗纳德 
Precision 精 度：一 个表示中数字的个数 
double 双精度 


索引与词汇表 


multiple 多精度 
quadruple 四倍精度 

single 单精度：能被一个计算机字容纳 
unlimited 无限精度，也见 Multipkrprecision 
Preconditioning 预先处理，见 Adaptation 
Prediction tests 预测检验 

Preston ， Richard McCann 普宙斯顿，理查德•麦卡恩 
Primality testing 素性检验 
Prime chains 素数链 

Prime numbers 索数 ：大于 1且无真因子的整数 
distribution of 索数分布 
enumeration of 素数枚举 
factorization into 分解成素因子 
largest known 已知的最大素数 
Mersenne 梅森索数 
size of wth 第 w 个素数的大小 
useful 有用的素数 
useless 无用的素数 
verifying primality of 检验索约性 
Primes in a unique factorization domain 惟一因子分 

解整环上的索数 

Primitive element modulo m 模 m 本原元 
Primitive notations for numbers 数的本原表示法 
Primitive part of a polynomial 多项式的本原部分 
Primitive polynomial 本原多项式 
Primitive polynomial modulo p 模 p 本原多项式 
Primitive recursive function 原始递归函数 
Primitive root 原根：一个有限域中的本原元 
Pritchard,Paul Andrew 普里査德，保罗•安德鲁 
Probabilistic algorithms 概率算法，见 Randomized al¬ 
gorithms 

Probability 概率 ：发生 的机率 
abuse of 概率的滥用 
over the integers 整数上的概率 
Probert,Robert Lome 普罗伯特，罗伯特•洛恩 
Programming languages 程序设计语言 
Pronouncing hexadecimal numbers 十六进制数的读 

音 

Proof of algorithms 算法证明 

Proofs > constructive versus nonconstructive 构造性与 

非构造性的证明 

Proper factor of v u 的真因子 ：既非 1 也非 i ； 本身 
的的因子 

Proth,Francois Toussaint 普罗思，弗朗科伊斯 • 图森 

特 

Proulx ， Rene 普罗克斯，雷纳 


Pseudo-division of polynomials 多项式的伪除法 
Pseudorandom sequences 伪随机序列 
Ptolemy , Claudius( ritoXe/ia io^ KXa uSto^) 普托里米， 
克劳迪亚斯 

Public key cryptography 公钥密码 

Purdom, Paul Walton Jr. 小珀多姆，保罗•沃尔顿 

Pyke,Ronald 派克，罗纳德 

g-series 级数 

Quadratic congruences ， solving 二次同余的解 
Quadratic congruential sequences 二次同余序列 
Quadratic forms 二次型 

minimizing,over the integers 整数上的二次型极小 
化 

Quadratic irrationalities, continued fractions for 二次 

无理性的连分数 

Quadratic reciprocity law 二次互反律 
Quadratic residues 二次剩余 
Quadratic sieve method 二次筛方法 
Quadruple-precision arithmetic 四倍精度算法 
Quandalle, Philippe 匡特尔，菲利普 
Quasirandom numbers 拟随机数 
Quater-imaginary number system 虚四数系统 
Quaternary number system 四进制数系统 
Quick Jonathan Horatio 奎克，乔纳森•霍雷肖 
Quinary number system 五进制数系统 
Quolynomial chains 四项链 
Quotient ：iulvj 商，见 Division 
of polynomials 多项式的商 
partial 部分商 
trial 试除的商 

Rabin, Michael Oser 拉宾，迈克尔•奥泽 
Rabinowitz,Philip 拉宾诺维茨，菲利普 
Rademacher ， Hans 拉德梅彻尔，汉斯 
Radioactive decay 放射性衰变 

Radix ： Base of positional notation 进制：定位记法的 
基 

complex 复数进制 
irrational 无理进制 
mixed 混合进制 
negative 负进制 
Radix conversion 

floating point 浮点进制转换 
multiprecision 多精度进制转换 
Radix point 小数点 

Raimi,Ralph Alexis 雷米，拉尔夫•亚历克西斯 
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Raleigh, Walter 雷利，沃尔特 
Rail,Louis Baker 拉尔，路易斯•贝克 
Ramagejohn Gerow 拉梅奇，约翰•杰罗 
Ramanujan Iyengar ， Srinivasa 拉马努扬 • 艾扬加尔， 
斯里尼瓦沙 

Ramaswami , Vammi 拉马斯瓦米，范米 
Ramshaw , Lyle Harold 拉姆肖，莱尔•哈罗德 
ran —array ran _ array 子程序 

RAND Corporation 兰德公司 
Randell, Brian 兰德尔，布赖恩 
Random bits 随机位 


Random combinations 随机组合 
Random directions 随机方向 

Random fractions 随机分数，见 Uniform deviates 
Random functions 随机函数 
Random integers 随机整数 


among ali positive integers 正整数上的随机整数 
in a bounded set 有界集合中的随机整数 
Random mappings 随机映像 

Random number generators 随机数生成器（程序） 
for nonuniform deviates 非一致偏离随机数生成程 

序 


for uniform deviates —致偏离随机数生成程序 
machines 随机数生成器 

summary 随机数生成程序小结 
tables 随机数表 
testing 随机数检验 

using 使用随机数，也见 Randomized algorithms 
Random permutations 随机排列 

of a random combination 随机组合的排列 
Random point,in a circle — 个圆内的随机点、 
in a sphere —个球内的随机点 
on an ellipsoid —个捕球内的随机点 
on a sphere 一个球面上的随机点 
Random polynomials 随机多项式 
Random random number generators 随机的随机数生 

成程序 


Random real numbers 随机实数 
Random samples 随机抽样 
Random sequences,meaning of 随机序列的意义 
finite 有限随机序列 


Randomized algorithms 随机化 算法： 使用随机数且 
通常产生正确答案的箅法 
Randomness, guaranteed 保证的随机性 
RANDU RANDU 随机数生成器 
Rangan 兰根，见 Pandu Rangan 


Range arithmetic 范围算术 
Rank,of apparition 出现的秩 
of a matrix 矩阵的秩 
of a tensor 张堂的秩 
RANLUX RANLOX 随机数生成器 

Rap music 说唱乐 

Rapoport ， Anatol 拉波波特，阿纳托尔 
Ratio method 比例方法 
Rational arithmetic 有理算术 

Rational function approximation 有理函数逼近 
Rational functions 有理函数 

approximation and interpolation 有理函数逼近和 

内插 

Rational numbers 有理数 

approximation by 用有理数逼近 
mod m 模 m 有理数 
polynomials over 有理数上的多项式 
positional representation of 有理数的定位表示 
Rational reconstruction 有理重构 
Real numbers 实数 
Real time 实时 

Realization of a tensor 张置的实现 
Reciprocal differences 倒数差 
Reciprocals 倒数 

floating point 浮点倒数 
mod V 模 Y 倒数 
mod m 模 m 倒数 
power series 幕级数倒数 
Reciprocity laws 互反律 
Recorde, Robert 雷科德，罗伯特 
Rectangle-wedge-tail method 矩形 - 楔形-尾形方法 
Rectangular distribution 矩阵分布，见 Uniform 
distribution 

Recurrence relations 递推关系 
Recursive processes 递归过程 

Reeds,James Alexander 里德斯，廢姆斯*亚历山大 
Rees,David 里斯，戴维 
Registers 寄存器 

Regular continued fractions 正则连分数 
Reiser John Fredrick 赖泽，约翰•弗雷德里克 
Reitwiesner,George Walter 赖特维斯纳，乔治•沃尔 
特 

Rejection method 拒绝方法 
Relative error 相对误差 
Relatively prime 互 素：没 有公共素因子 
polynomials 互素多项式 
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Remainder 余数，余式，剩余：被除数减去商与除数 
的积，也见 mod 
Replicative law 重复律 

Representation of numbers 数的表 7K ，见 Number 


systems 

Representation of trees 树的表 7K 
Representation of 00 00 的表示 

Reservoir sampling “ 水库 ” 抽样，储蓄器抽样 
Residue arithmetic 剩余算术 
Result set 结果集 

Resultant of polynomials 多项式的结式 

Revah, Ludmila 雷维，勒德米拉 

Reverse of a polynomial 多项式的反演 

Reversing binary number system 反序二进数系统 

Reversion of power series 幕级数的反演 

Revolving binary number system 旋转的二进数系统 

Rezucha, Ivan 雷朱卡，伊凡 

Rhind papyrus 莱因德文稿 

Rho method for factoring 因子分解的罗方法 

Riccati,Jacopo Francesco, equation 里卡蒂，雅各波 • 

弗朗西斯科方程 

Rieger, Georg Johann 里格，乔治•约翰 

Riemann,Georg Friedrich Bernhard 黎曼，乔治•弗雷 

德里克•伯恩哈德 
hypothesis 黎曼假说 
hypothesis , generalized 义黎曼假说 

integration 黎曼积分 
Riffle shuffles 里弗尔洗牌法 
Ring with identity , commutative 可交换的么元的环 
Riordan,John 赖尔登，约翰 
Rising powers 上升幕 
Ritzmann ， Peter 里茨曼，彼得 
Rivat Joel 里瓦特，乔尔 
Ri vest, Ronald Linn 里夫斯特，罗纳德•林 
Robber 罗拍 

Robinson,Donald Wilford 鲁宾逊，唐纳德•威尔福德 
Robinson,Julia Bowman 鲁宾逊，朱莉娥•鲍曼 
Robinson,Raphael Mitchel 鲁宾逊，拉斐尔•米切儿 
Roepstorff,Gert 罗普斯托夫，格特 
Rolletschek ， Heinrich Franz 罗赖茨切克，海因里希 * 

弗朗兹 

Roman numerals 罗马数字 
Romani ， Francesco 罗马尼，弗朗西斯科 
Roof , Raymond Bradley 鲁夫，雷蒙德•布雷德利 
Roots of a polynomial 多项式的根 
multivariate 多变量多项式的根 


Roots of unity 单位根，见 Cyclotomic polynomials, 
Exponential sums 

Ross,Douglas Taylor 罗斯，道格拉斯•泰勒 
Rotenberg, Aubey 罗登贝格，奥比 
Rothe, Heinrich August 罗思，海因里希•奥古斯特 
Rouche,Eugene, theorem 鲁彻，尤金定理 
Roulette 轮盘赌 
Round to even 舍人成偶数 
Round to odd 舍人成奇数 
Rounding 舍人 
mediant 中间舍人 
Rounding errors 舍入误差 
Rounding overflow 舍人上溢 

Rozier , Chalres P. 罗齐尔，查尔斯 • P 

RSA box RSA 箱 

RSA encryption RSA 密码 

Rudolff ,Christof 鲁道夫，克里斯托弗 

Rumely^Robert Scott 鲁姆利，罗伯特•斯科特 

Run test 运行检验 

Runs above (or below) the mean 在均值之上（或之 
下）运行 

Runs in a permutation 排列中的运行 
Russian peasant method 俄罗斯农民方法 
Rozsa，Imre Zoltan 鲁齐沙，伊姆里.佐尔坦 
Ryser, Herbert John 赖施尔，赫伯特•约翰 

$ N N 源 

Saarinen ， Jukka Pentti Paivio 萨里南，朱卡 • 彭蒂•佩 
维欧 

Sachau,Karl Eduard 萨考，卡尔*埃杜瓦德 
Saddle point method 鞍点方法 
Sahni ,Sartaj Kumar 萨尼，萨尔塔•库默 
Saidan, Ahmad Salim 塞旦，阿马德•萨利姆 
Salamin,Eugene 萨拉明，尤金 
Salfi,Robert 萨尔菲，罗伯特 
Samelson, Klaus 萨梅尔森，克劳斯 
Samet,Paul Alexander 萨梅特，保罗 * 亚历山大 
Sampling (without replacement) 抽样（无替换） 

Sands ， Arthur David 桑兹，阿瑟•戴维 
Saunders,Benjamin David 桑德斯，本杰明•戴维 
Savage,John Edmund 萨维奇，约翰‘埃德蒙德 
Sawtooth function ((x )) 锅齿函数 

Saxe, James Benjamin 萨克斯，詹姆斯•本杰明 
Scarborough，James Blaine 斯卡巴勒，詹姆斯•布莱恩 
Schatte,Peter 沙特，彼得 
Schelling,Hermann von 谢林，赫尔曼•冯 
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Schmid,Larry Philip 施米德，拉利•菲利普 
Schmidt, Erhard 施米特，埃哈德 
Schmidt ， Wolfgang M 施米特，沃尔夫冈 • M 
Schnorr , Claus~Peter 施罗尔，克劳斯-彼得 
Scholz ， Arnold 肖尔茨，阿诺德 
SchobrBrauer conjecture 肖尔茨〜布劳尔猜想 
Schonemann, Theodor 舍尼曼，西奧多 
Schonhage, Arnold 舍恩哈格，阿诺德 
Schonhage^Strassen algorithm 舍恩哈格 -斯特 拉森算 

法 

Schooling, William 斯库林，威廉 

Schreyer , Helmut 施赖伊尔，赫尔穆特 

Schroder ， Friedrich Wilhelm Karl Ernst 施罗德，弗里 

德里克 • 威廉 • 卡尔 •厄恩斯特 
function 施罗德函数 

Schroeppel,Richard Crabtree 施罗皮尔，理查德•克 
雷布特里 

Schubert , Friedrich Theodor von 舒伯特，弗里德里克 

•西奥多 

Schwartz ， Jacob Theodore 施瓦茨，雅各布•西奥多 

Schwarz = (Svarc) , Stefan 施瓦茨，斯蒂芬 

Schwenter , Daniel 施文特，丹尼尔 

Sec rest , Don 西克雷斯特，唐 

Secret keys 密钥 

Secure communications 安全通信 

Sedgewick, Robert 塞奇威克，罗伯特 

Seed (starting value)in a linear congruential sequence 

一个线性同余序列中的种子（开始值） 

Seidenberg , Abraham 塞登伯格，亚伯拉罕 
Selection sampling 选择抽样 
Selenius,Clas-01of 塞莱尼厄斯，克拉斯-奥洛夫 

Self-reproducing numbers 自再生数 

Self ridge, John Lewis 塞尔弗里奇，约翰•刘易斯 
Semi-online algorithm 半在线算法 
Semigroup 半群 

Seneschol , David 塞内斯克尔，戴维 

Septenary (radix 7) number system 七进制数系统 

Serial correlation coefficient 序列相关系数 

Serial correlation test 序列相关检验 

Serial test 序列检验 

Seroussi t Gadiel 塞路斯，加迭尔 

Serret, Joseph Alfred 塞雷特，约瑟夫•阿尔弗雷德 

Sethi f Ravi 塞思，拉维 

SETUN computer SETUN 计算机 

Sexagesimal number system 六十 进制数系统 

Seysen, Martin 塞森，马丁 


Shakespeare( = Shakspere) , William 莎士比亚，威廉 
ShaUit, Jeffrey Outlaw 沙历特，杰弗里•奥特洛 
Shamir , Adi 沙米尔，艾迪 
Shand , Mark Alexander 香德，马克•亚历山大 
Shanks,Daniel Charles 香克斯，丹尼尔•査尔斯 
Shanks ， William 香克斯，威廉 

Shannon , Claude El wood, Jr. 小香龙，克劳德•埃尔 

伍德 

Shaw,Mary Margaret 肖，玛丽•玛格刚特 

Shen ， Kangshen 沈康身 

Sheriff 行政司法长官，警长 

Shibata, Akihiko 柴田昭彦 

Shift operators of MIX MIX 的移位操作符 

Shift register recurrences 移位寄存器递推 

Shift-symmetric N-source 移位对称 N 源 

Shirley,John William 雪莉，约翰•威廉 

Shokrollahi, Mohammad Amin 肖克罗拉西，穆哈默 

德•阿米恩 

Short vectors 短向量 
Shoup , Victor John 肖普，维克多•约翰 
Shub,Michaes Ira 舒布，迈克斯•艾拉 
Shuffled digits 混洗后的数字 
Shuffling a sequence 混洗一个序列 
Shuffling cards 洗牌 

Shukla,Kripa Shankar 舒克拉，克里帕•香克尔 
Sibuya , Masaaki 涉谷政昭 

SICOMP ： SIAM Journal on Computing ，published by 
the Society for Industrial and Applied Mathematics 
since 1972 《 SIAM 计算杂志》 ：工 业与应用数学 
学会 1972 年创立的杂志 
Sideways addition 侧向加法 
Sierpinski , Waclaw 西彭斯基，瓦克劳 
Sieve methods 筛方法 
Sieve of Eratosthenes 伊拉托斯尼斯筛 
Sieveking, Malte 西夫金，马尔蒂 
Signatures, digital 数字签名 

Signed magnitude representation 带符号量的表 7K 
Significant digits 有效数字 
Sikdar , Kripasindhu 西格达，克里帕辛杜 
Silverman , Joseph Hillel 西尔弗曼，约瑟夫•希勒尔 
Simplex,recursively subdivided 递归再分的单纯形 
Simulation 模拟 

Sinclair , Alistair 辛克莱，阿利斯泰尔 
Sine 正弦 

Singh，Avadhesh Narayan 辛格，阿瓦德斯•纳拉燕 
Sink vertex 下沉顶点 
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SKRZAT 1 computer SKRZAT 1 计算机 
Slash arithmetic 开缝算术 
SLB( shift left rAX binary ) 左移寄存器 AX 指令 
Slide rule 计算尺 

Sloane, Neil James Alexander 斯隆，尼尔 • 詹姆斯•亚 
历山大 

Slowinski ， David Allen 斯洛文斯基，戴维 * 艾伦 
Small step 小步 

Smirnov, Nikolai Vasilievich ( Cmjhphob ， HjHKOJiaH 

BacHJibeBHH) 斯米尔诺夫，尼古拉伊•瓦西里耶 
维奇 

Smith, David Eugene 史密斯，戴维•尤金 

Smith,David Michael 史密斯，戴维•迈克尔 

Smith,Henry John Stephen 史密斯，亨利 • 约翰•斯蒂 

芬 

Smith,James Everett Keith 史密斯，詹姆斯•埃弗雷 
特•基思 

Smith,Robert Leroy 史密斯，罗伯特•勒鲁瓦 
Sobol, Ilya Meerovich (Co6onb, Hnbn MeepoBHq ) 索 

伯尔，伊利亚•米罗维茨 

SODA ： Proceedings of the ACM - SIAM Symposia on 
Discrete Algorithms, inaugurated in 1990 《 ACM- 
SIAM 离散算术会议论文集》 

Soden, Walter 索登，沃尔特 
Solitaire 单人纸牌游戏 

Solomonoff，Ray Joseph 所罗莫诺夫，雷•约瑟夫 
Solovay , Robert Martin 索洛韦，罗伯特•马丁 
Sorenson Jonathan Paul 索伦森，乔纳森•保罗 
Sorted uniform deviates 排好序的一致偏离 
Source vertex 源顶点 
Sowey , Eric Richard 索韦，埃里克•理查德 
Space- filling curves 间隔填充曲线 
Spacings 间隔 

Sparse polynomials 稀疏多项式 
Specht , Wilhelm 施佩希特，威廉 
Species of measure zero 测度为 0 的种类 
Spectral test 谱检验 

algorithm for 谱检验的算法 
examples 谱检验举例 
generalized 义谱检验 

Spence ， Gordon McDonald 斯彭斯，戈登•麦克唐纳 
Spencer Brown,David John 斯潘塞 • 布朗，戴维■约翰 

Sphere, n-dimensional n 维球 

random point in n 维球内的随机点 
random point on n 维球面上的随机点 
volume of n 维球的体积 


Spherical coordinates 球坐标 
SQRT box SQRT 盒 

Square root 平方根 

modulo m 摸 m 平方根 
modulo p 填 p 平方根 
of power series 幕级数的平方根 
of uniform deviate — 致偏离的平方根 
Squarefree factorization 无平方因子分解 
Squarefree polynomials 无平方多项式 
Squeeze method 挤压方法 

SRB (shift right rAX binary) rAX 二进制右移指令 
Stability of polynomial evaluation 多项式求值的稳定 
性 

Stack 栈 ：具有 后进先出增长模式的线性表 
Stahnke, Wayne Lee 斯坦克，韦恩•李 
Standard deviation,evaluation of 标准差的计算 
Stanley , Richard Peter 斯坦利，理査德■彼得 
Star chains 星链 
Star step 星步 

Stark ， Richard Harlan 斯塔克，理查德•哈兰 
Starting value in a linear congruential sequence 线性同 

余序列的初始值 

Statistical tests 统计检验，见 Testing 
Steele,Guy Lewis,Jr 小斯蒂尔，盖伊•刘易斯 
Steffensen,Johan Frederik 斯蒂芬森，约翰•弗雷德 
里克 

stegun,Inene Anne 斯蒂冈，艾琳•安妮 
Stein, Josef 斯坦，约瑟夫 
Stein ， Marvin Leonard 斯坦，马文•伦纳德 
Stern, Moritz Abraham 斯特恩，莫里兹•亚伯拉罕 
Stern-Brocot tree 斯特恩-布罗科特树 
Stevin,Simon 史蒂文，西蒙 
Stibitz,George Roberto 斯蒂比兹，乔治•罗伯特 
Stillingfleet , Edward 斯蒂林弗利特，爱德华 
Stirling,James 斯特林，詹姆斯 
approximation 斯特林近似 
numbers 斯特林数 

STOC：Proceedings of the ACM Symposia on Theory of 
Computing, inaugurated in 1969 《ACM 计算理 
论会议论文集》 

Stockmeyer ， Larry Joseph 斯托克迈耶，拉里•约瑟夫 
Stoneham, Richard George 斯托纳姆，理査德•乔治 
Stoppard, Tom = (St ra ussier, Tomas) 斯托帕德，汤姆 
=( 斯特劳斯勒，托马斯） 

Storage modification machines 存储修改机器 
Strachey ， Christopher 斯特雷奇，克里斯托弗 
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Straight-line program 直线程序 

Strassen ， Volker 斯特拉森，沃尔克 

Straus,Ernst Gabor 施特劳斯，厄恩斯特•加波尔 

String polynomials 串多项式 

Stringent tests 斯特林金特检验 

Stroud, Arthur Howard 斯特劳德，阿瑟•崔华德 

Struve, Wassilij Wassiliewitsch ( Cxpyse, 

BacHJibeBHVi) 斯特拉弗，瓦西利 • 瓦西列维奇 
Sturm,Jacob Karl Franz 斯特姆，雅各布 ■ 卡尔•弗朗 
兹 

Subbarao, Mathukumalli Venkata 萨巴劳，马图古马 
里•文卡塔 

Subexponential (nice) functions 好函数 
Subresultant algorithm 子结式算法 
Subsequence rules 子序列规则 
Subsequence tests 子序列检验 
Subsequences 子序列 

Subset FORTRAN language 子集 FORTRAN 语言 
Subtract-and-shift cycle 减和移位循环 
Subtract-with-lx)rrow sequence 带借位减序列 
Subtraction 减法 
complex 复数减法 
continued fractions 连分数减法 
double-precision 双精度减法 
floating point 浮点减法 
fractions 分数减法 
mod m 模 w 减法 
modular 模数减法 
multiprecision 多精度减法 
polynomial 多项式减法 
power series 幕级数减法 

Subtractive random number generator 减法随机数生 

成程序 

Sugunamma ， Mantri 萨古南姆马，曼特里 
Sukhatme , Pandurang Vasudeo 苏克哈特米，潘都兰 * 

瓦苏迪奥 

Sum of periodic sequences f mod m 模 rw 周期序列的 
和 

Summation by parts 分部求和 
Sun Tsu ( = SOnzT，Master Sun) 孙子 
Sun SPARCstation Sun SPA_RC 工作站 
Suokonautio, Vilho 索科璃蒂奥，维尔霍 
Svoboda , Antonin 斯沃博达，安托宁 
Swarztrauber,Paul Noble 斯沃茨特劳博，保罗•诺布 
尔 

Swedenborg ， Emanuel 斯维登博格，伊曼纽尔 
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Sweeney , Dura Warren 斯威尼，杜拉•沃伦 
SwinnertorrDyer, Henry Peter Francis 斯温纳顿-戴 

尔，亨利 • 彼得•弗朗西斯 

Sykora f Ondrej 西科拉，翁德列 
Sylvester James Joseph, matrix 西尔威斯特，詹姆斯 • 
约瑟夫矩阵 

Szabo J ozsef 萨博，约瑟夫 

Szabo,Nicholas Sigismund 萨博，尼古拉斯•西格斯蒙 
德 

Szekeres , George 塞克里斯，乔治 
Szyraanski , Thomas Gregory 西曼斯基，托马斯•格里 
戈里 

卜 ary trees Z 叉树 

Tabari .Mohammed ben Ayyub 塔巴里，穆哈默德•本 

•艾尤比 

Tables of fundamental constants 基本常数表 
Tabulating polynomial values 表格多项式值 
Tague ， Berkley Arnold 塔格，伯克利■阿诺德 
Tail of a floating point number 浮点数的尾部 
Tail of the binomial distribution 二项式分部的尾部 
Tail of the normal distribution 正太分布的尾部 
Takahashi, Daisuke 高橋大介 
Takahasi ， Hidetosi 高橋秀俊 
Tamura, Yoshiaki 田村良明 
Tanaka,Richard Isamu 田中 1 J 千十 ^— K 勇 
Tangent 正切 
tanh 双曲正切 
Tannery,Jules 坦尼里，朱尔斯 
Taranto, Donald Howard 塔兰托，唐纳德•崔华德 
Tarski , Alfred 塔斯基，艾尔弗雷德 
Tate, John Torrence, Jr. 小塔特，约翰•托伦斯 
Tate,Stephen Ralph 塔特，斯蒂芬•拉尔夫 
Taussky Todd,Olga 陶斯基 • 托德，奥尔加 
Tausworthe , Robert Clem 陶斯沃思，罗伯特•克莱姆 
Taylor , Alfred Bower 泰勒，艾尔弗雷德•鲍尔 
丁 ay lor ， Brook ， theorem 泰勒，布符克定理 
Taylor, William Johnson 泰勒，威廉•约翰逊 
Television script 电视剧本 
Ten’s complement notation 十的补码记法 
Tensors 张适 
Term 项：被加的量 
Terminating fractions 有穷小数 
Ternary number system 三进制数系统 
balanced 平衡的三进制数系统 
Testing for randomness 随机性的检验 
a priori tests 随机性检验的先验检验 
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chi-square test % 2 检验 
collision test 冲突检验 
coupon collector’s test 集券检验 
empirical tests 经验检验 
equidistribution test 等分布检验 
frequency test 频率检验 
gap test 间隔检验 

Koimogorov-Smirnov test 科尔莫戈罗 夫-斯 米尔诺 

夫检验 

maxi mum-of 4 test t 的极大值检验 
partition test 分划检验 
permutation test 排列检验 
run test 运行检验 
serial correlation test 序列相关检验 
serial test 序列检验 
spectral test 谱检验 
subsequence tests 子序列检验 
theoretical tests 理论检验 
torture test 折磨检验 

TEX TEX 排版系统 
Tezuka,Shu 手塚集 

Thacher ， Henry Clarke, Jr. 小撒切尔，亨利 * 克拉克 
Theoretical tests for randomness 随机性的理论检验 
Thiele,Thorvald Nicolai 蒂利，索瓦尔德•尼古拉 
Thompson,John Eric Sidney 汤普森，约翰 • 埃里克 * 

西德尼 

Thomson, William Ettrick 汤姆森，威廉•埃特里克 
Thurber ， Edward Gerrish 瑟伯，爱德华•格里什 
Tichy,Robert Franz 蒂奇，罗伯特•弗朗茨 
Tienari, Martti Johannes 蒂纳里，马蒂•约翰尼斯 
Tingey ， Fred Hollis 廷吉，弗雷德•翟利斯 
Tippett, Leonard Henry Caleb 蒂皮特，伦纳德 • 亨利 • 

凯莱布 

Tiwari , Prasoon 蒂瓦里，普拉苏恩 

Tobey ， Robert George 托比，罗伯特•乔治 

Tocher, Keith Douglas 托切尔，基斯•道格拉斯 

Todd ， John 托德，约翰 

Todd,Olga Taussky 托德，奥尔加•陶斯基 

Toeplitz,Otto 托耶普利兹，奥托 

Tonal System 音调系统 

Tonelli, Alberto 托内利，艾伯托 

Toolkit philosophy 工具箱原理 

Toom, Andrei Leonovich ( Toom , AH^peft JIbohobh^) 

图姆，安德雷•利奥诺维奇 
Toom-Cook algorithm 图姆-库克箅法 
Topological sorting 拓扑排序 


Topuzoglu, Alev 托普佐格鲁，艾利弗 
Torelli , Gabriele 托雷利，加布里埃尔 
Torresy Quevedo , Leonardo de 托里斯 - 奎韦多，伦纳 

XjrJLf -/bfry 

德•德 

Torture test 折磨检验 

Trabb Pardo ， Luis Isidoro 特拉布 • 帕多，卢斯•伊西 
多洛 


Trace of a field element 一 * 个域元素的迹 
Trager，Barry Marshall 特拉格尔，巴里•马歇尔 
Trailing digit 尾部数字 
Transcendental numbers 超越数 
Transitive permutation groups 传递排歹 1 J 组 
Transpose of a tensor 张量的转置 
T ranspositions 转置 

Traub Joseph Frederick 特劳布，约瑟夫•弗雷德里 

克 

Trees 树:分支信息结构 

binary 二叉树 
complete binary 完备二叉树 
enumeration of 树的枚举 
oriented 有向树 


r_ary /叉树 

Trevisan, Vilmar 特里维桑，维尔默 


Trial quotients 试验的商 
Trlangulari 2 ation of matrices 矩阵的三角化 

Tries 检索结构 

Trigonometric functions 三角函数 


Trilinear representation of tensors 张量的三线性表示 
Triple^precision floating point 三精度浮点 
Trits 特里兹 


Truncation 截取：去掉末尾数字 
Tsang,Wai Wan 曾卫寰 
Tsu Ch’ ung-Chih( = Zu Chongzhl ) 祖冲之 
Tsuji, Masatsugu 遷正次 
Tukeyjohn Wilder 图基，约翰 * 怀尔德 
Turan^Paul 图兰，保罗 
Turing, Alan Mathison 图灵，艾伦 • 马西森 
machines 图灵机 
Twindragon fractal 双龙碎片 
Two squares,sum of 平方和 

■ 

Two’s complement notation 2 的补码记法 
Twos’ complement notation 2 的辛卜码 i 己法 
Tydeman,Fredrick John 泰德曼，弗雷德里克•约翰 


Ulam,Stanislaw Marcin 乌兰姆，斯坦尼斯劳•马辛 
U liman Jeffrey David 乌尔曼，杰弗里 • 戴维 
Ullrich,Christian 乌尔里克，克里斯琴 
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Ulp 最后一位的 1 

Underflow , exponent 指数的下溢 
gradual 逐渐下溢 
Ungar, Peter 昂加尔，彼得 
Uniform deviates 一 ^ 致偏离： 一 致分布的随机数 

generating 生成一致偏离 
logarithm of 一 致偏离的对数 
sorted 排序的一致偏离 
square root of 一■致偏离的平方根 
Uniform distribution —致分布 
Unimodular matrix 单模矩阵 
Unique factorization domain 惟一因子分解整环 
Units in a unique factorization domain 一 因子分解 

整环上的单位 

Unity : The number one 单位：数 1 

roots of 单位根，也见 Cyclotomic polynomials, Ex¬ 
ponential sums 

Unlimited precision 无限精度，也见 Multiple - preci¬ 
sion 

Unnormalized floating point arithmetic 未规格化浮点 

算术 

Unusual correspondence 非常相关 
Useful primes 有用的素数 

Uspensky,lames Victor 乌斯宾斯基，詹姆斯 • 维克 

托 

Vahlen ， Karl Theodor 瓦伦，卡尔•西奥多 

Valach ， Miroslav 瓦拉克，米罗斯拉菲 

Valiant,Leslie Gabriel 瓦利昂特，莱斯利•加布里埃 

尔 

Vallee,Brigitte 瓦利，布里吉特 

Valiee Poussin ,Charles^Jean-Gustave~Nicolas de la 瓦 

利 • 波辛，查尔斯 - 琼 • 古斯塔瓦 - 尼古拉斯•德拉 

Valtat , Raymond 瓦尔塔特，雷蒙德 

van Ceulen ， Ludolph 范修林，卢多尔夫 

van de Wiele t Jean _ Paul 范德威勒，琼•保罗 

van der Corput,Johannes Gualtherus 范德科普特，约 

翰尼斯•高尔锡拉斯 

van der Poorten , Alfred J acobus 范德普尔顿，艾尔弗 

雷德•雅各布斯 

van der Waerden，Bartel Leendert 范德瓦尔登，巴特 

尔•利恩德特 

van Halewyn , Christopher Neil 范哈勒维，克里斯托 

夫•内尔 

van Leeuwen,Jan 范利夫文，简 

Van Loan , Charles Francis 范劳恩，査尔斯•弗朗西斯 

van Wijngaarden , Adriaan 范维恩加登，艾德里安 


Vari ， Thomas Michael 瓦里，托马斯•迈克尔 
Variables 变童 

Variance , unbiased estimate of 方差的无偏倚估计 
Variance - ratio distribution 方差比分布 
Vattulainen , Ilpo Tapio 瓦图莱伦，伊尔波•塔皮奥 
Vaughan , Robert Charles 沃恩，罗伯特•査尔斯 
Velthuis, Frans Jozef 维尔修斯，弗朗兹•约瑟夫 
Veltkamp, Gerhard Willem 维尔特卡姆，格哈特•威 

廉 

Vershik, Anatoly Moiseevich ( BepmHK, AHaTOJiHK 

MoHceeBMH) 韦尔斯基，阿纳托利•莫伊谢耶维 
奇 

V ertex cover 项点覆盖 

Vetter ， Herbert Dieter Ekkehart 维特，赫伯特•迪特 

尔•埃克哈特 

Viete, Francois 维特，弗朗科伊斯 
Ville Jean 维利，琼 

Vitanyi,Paul Michael Bela 维坦尼，保罗 • 迈克尔•贝 

拉 

Vitter,Jeffrey Scott 魏杰甫 

Vogel,Otto Hermann Kurt 沃格尔，奥托•赫曼库尔 

特 

Voltaire,de ( = Arouet, Francois Marie) 沃尔特尔， 

德 （= 阿罗特，弗朗科伊斯 • 玛丽） 

Volume of sphere 球的体积 

von Fritz, Kurt 冯弗里茨，库尔特 

von Mangoldt , Hans Carl Friedrich 冯曼戈尔特，汉斯 

* 卡尔 * 弗里德里克 

function 冯曼戈尔特函数 

von Mises , Richard , Edler 冯迈西斯，理查德，埃德勒 

尔 

von Neumann,John ( = Margittai Neumann Janos ) 冯 

诺伊曼，约翰 （ = 马吉泰 • 诺伊曼 ‘ 雅诺什） 

von SchelUng ， Hermann 冯谢林，赫曼 

von Schubert , Friedrich Theodor 冯舒伯特，弗里德里 

克*西奥多 

von zur Gathen,Joachim Paul Rudolf 冯朱尔盖森，乔 

基姆 • 保罗•鲁道夫 

Vowels ， Robin Anthony 沃韦尔斯，罗宾•安东尼 
Vuillemin , Jean Etienne 维勒明，琼•埃蒂恩 

Wadel , Louis Burnett 韦德尔，路易斯•伯内特 
Wadey，Walter Geoffrey 韦迪，沃尔特•杰弗里 
Waerden , Bartel Leendert van der 瓦尔登，巴特尔 • 利 

恩德特 • 范*德 
Waiting time 等候时间 
Wakulicz , Andrzej 韦古里茨，安德烈 
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Wald ， Abraham 沃尔德，亚伯拉罕 
sequence 沃尔德序列 

Wales,Francis Herbert 韦尔斯，弗朗西斯•赫伯特 
Walfisz, Arnold 沃尔费茨，阿诺德 
Walker, Alastair John 沃克，阿拉斯泰尔•约翰 
Wall ， Donald Dines 沃尔，唐纳德 • 丹斯 
Wall,Hubert Stanley 沃尔，休伯特•斯坦利 
Wallace,Christopher Stewart 华莱士，克里斯托弗 
斯图尔特 

Wallisjohn 沃利斯•约翰 
Walshs Joseph Leonard 沃尔什，约瑟夫•伦纳德 
transform 沃尔什变换 
Wang,Paul ShyhrHorng 王士弘 
Ward , Morgan 沃德，摩根 
Waring, Edward 韦林，爱德华 

Warlimont ， Richard Clemens 沃利蒙特，理查德•克莱 

门斯 

Watanabe , Masatoshi 渡边雅俊 

Waterman，Alan Gaisford 沃特曼，艾伦•盖斯福德 

Weather 天气 

Wedge-shaped distributions 模形分布 

Weigel ， Erhard 韦格尔，埃哈德 

Weighing problem 称重问题 

Weights and measures 度童衡 

Weinberger,Peter Jay 温伯格，彼得•杰伊 

Welch ， Peter Dunbar 韦尔奇，彼得•邓巴 

Welford, B. P. 韦尔福德， B*P 

Weyl，Claus Hugo Hermann 韦尔，克劳斯 • 雨果•赫 

尔曼 

Wheeler , David John 惠勒，戴维•约翰 

White Jon L 怀特，乔恩 ‘L 

White sequence 白序列（可靡的序列） 

Whiteside,Derek Thomas 怀特赛德，德里克•托马斯 
Whitworth , William Alien 惠特沃思，威廉♦艾伦 
Wichmann,Brian Anderson 威奇曼，布赖恩■安德森 
Wiedijk,Frederik 威迪克，弗雷德里克 
Wiele,Jean-Paul van de 威尔，琼 - 保罗 • 范♦德 
Wijngaarden, Adriaan van 维恩加登，安德里安•范 
Wilf, Herbert Saul 威尔弗，赫伯特•索尔 
Wilkes, Maurice Vincent 威尔克斯，莫里斯•文森特 
Wilkinson, James Hardy 威尔金森，詹姆斯•哈迪 
Williams, Hugh Cowie 威廉斯 ，休 •考伊 
Williams John Hayden 威廉斯，约翰•海登 
Williamson , Dorothy 威廉森，多萝西 
Wilson,Edwin Bidwell 威尔森，埃德温•比德韦尔 
Winograd,Shmuel 维诺格拉德，斯米尔 


Wirsing,Eduard 威欣，爱杜瓦德 

WM1 (word size minus one ) 字长减 1 指令 

Wolf , Thomas Howard 沃尔夫，托马斯•翟华德 

Wolff von Gudenberg , Jiirgen Freiherr 沃尔夫 * 冯•古 

登伯格，朱尔金 •弗 莱赫尔 

Wolfowitz,Jacob 沃尔福威茨，雅各布 
Woltman, George Frederick 沃尔特曼，乔治■弗雷德 
里克 

Wood,William Wayne 伍德，威廉■韦恩 
Word length 字长：字大小的对数 
Word size 字的大小 

Wrench,John William,Jr. 小伦奇，约翰 ■ 威廉 
Wright .Edward Maitland 赖特，爱德华•梅特兰 
Wunderlich, Charles Marvin 旺德利奇，查尔斯•马文 
Wynn,Peter 温，彼得 

Wynn-Williams，Charles Eryl 温 - 威廉斯，查尔斯•埃 
里尔 

Xie,Shenquan 谢深泉 
XOR (exclusive or ) 异或指令 

Yagati 亚加蒂，见 Lakshman 

Yagtom, Akiva Moiseevich (Htviom , Akhm MonceeBHq) 

亚格洛姆，阿基维•莫伊谢耶维奇 

Yaglom, Isaak Moiseevich (HrjiOM, HcaaK MonceeBH^) 

亚格洛姆，艾萨克•莫伊谢耶维奇 

Yao, Andrew Chi~Chih 姚期智 

Yao, Frances Foong Chu 姚储讽 

Yates, Frank 耶茨，弗朗克 

Yohe,James Michael 约埃，詹姆斯•迈克尔 

Young,Jeffery Stagg 扬，杰弗里‘斯塔格 

Younis,Saed Ghalib 扬尼斯，萨德♦格利布 

Yuditsky, Davit Islam Gireevich ( IOahukhA , /caBMT 
Hcjism THpeeBHM) 尤季茨基，达维 • 伊斯兰■季 
里维奇 

Yun,David Yuan-Yee 挥元一 
Yuriev,Sergei Petrovich (lOpbes,Cep^efi rieTpoBHq) 
尤里耶夫，谢尔盖•彼得罗维奇 

Z-independent vectors Z 独立向量 

Zacher,Hans-Joachim 札策尔，汉斯-乔基姆 

Zaman, Arif 札曼，艾里夫 

Zantema , Hantsje 赞特马，汉兹杰 

Zaremba , Stanislaw Krystyn 札仁姆巴，斯坦尼斯劳 ■ 

克里斯廷 

Zaring, Wilson Miles 札林，威尔逊•迈尔斯 
2assenhaus,Hans Julius 札森豪斯，汉斯•朱利叶斯 
2eilberger,Doron 蔡伯格，多罗恩 
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索引与词汇表 


Zero 零 

leading 前导零 
minus 负零 

order of magnitude 童零的阶 
polynomial 零多项式 
Zero divisors 零除数 
Zeta function JX 塔函数 


Zhang ♦ Linbo 张林波 
Zierler ， Neal 齐勒，尼尔 

Zippel, Richard Eliot 齐佩尔，理査德•埃利奥特 
Zuckerman ， Herbert Samuel 朱克曼，赫伯特•塞缪尔 
Zuse ， Konrad 朱斯，康拉德 

Zvonkin , Alexander Kalmanovich ( 3bohjchh ， AneKcaH^p 
KaJiMaHOBnq) 兹冯金，亚历山大•卡尔马诺维奇 


本书的写作是在安装了 Computer Modem 字体的一台 Sun SPARCstation 上完成的，使用了 TEX 和 META- 
FONT 软件 [ 作者的 Computers & Typesetting (Reading,Mass. : Addison-Wesley, 1^86), Volumes A 〜 E 中对此作了 
介绍]。插图用 John Hobby 的 METAPOST 系统制作。索引中的一些名词用到了其它一些字体，它们是由 Yarniis 

Haralambous(Greek , Hebrew, Arabic),Olga G. Lapko(Cyrillic) ,Frans J. Veithuis(Devanagari) ,Masatoshi Watanabe 

(Japanese ) ，和 Linbo Zhang(Chinese) 开发的。 - 原注 
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内容简介 


本书是国内外业界广泛关注的 7 卷本《计算机程序设计艺术》第 2 卷的最新 
版。本卷对半数值算法领域做了全面介绍，分“随机数”和“算术”两章。本卷总 
结了主要算法范例及这些算法的基本理论，广泛剖析了计算机程序设计与数值 
分析间的相互联系，其中特别值得注意的是作者对随机数生成程序的重新处理 
和对形式幂级数计算的讨论。 

本书附有大量习题和答案，标明了难易程度及数学概念的使用。 

本书内容精辟，语言流畅，引人入胜，可供从事计算机科学、计算数学、计算 
技术诸方面的工作人员参考、研究和借鉴，也是相关专业高等院校的理想教材和 
教学参考书。 

本次印刷已根据 http：//sunburn. Stanford. edu 厂 knuth/taocp• html 上的最新 

勘误表（截止到 2003 年 1 月 25 日 ） 校正了原版书中的错误。 



12 


05 


rX — 余数 

DIV(0 ： 5) 

FDIV(6) 


M(F)^-rI4 

ST4(0 ： 5) 


输人，设备 F 

IN(0) 


14:0, 转移 

J4[ + ] 


52 


rI4^[rI4]?±M 

INC4(0) DEC4(l) 
ENT4(2) ENN4(3) 


Cl 


14(F) ：V 


CMP4(0 ： 5) 


特殊的 

NUM(0) 
CHAR( 1) 
HLT(2) 


移位 M 个字节 

5 ： _A(0) 5PA (： 

T , LV ( 2 ) 

SLC ⑷ SRC(5 


y 、 m 移动 f 字 
到 rH 



13 


2 


14 


2 


15 


2 


rI5—V 

LD5(0 ： 5) 


rI6—V 

LD6(0 ： 5) 


rX 


LDX(C ： 


21 


rI5 


LD5N(0：5 


29 



22 


2 


23 


2 


rl6 

LD6N(0 ： 


V 


rX—- 

LDXN( 0 : 



31 


2 


M(F)^rI5 

ST5(0 ： 5) 


M(F)—rI6 

ST6(0-5) 


M(F)—rX 

STX(0 ： 5) 






输出，设备 F 

OUT(O) 


45 


H5:0, 转移 

J5[ + ] 


53 


r!5<-[r!5]?±M 

INC5(0) DEC5(l) 
ENT5(2) ENN5(3) 
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Cl 


I5(F)：V 


CMP5(0:5) 


设备 F 就绪 

jred(o) 



rI6:0, 转移 

J6[ + ] 


1 I 6 — [rI 6 ]? 士 M 

INC6(0) DEC6(l) 
ENT6(2) ENN6(3) 


62 


Cl—rI6(F):V 

CMP6(0 ： 5) 


转移 

JMP(O) JSJ(l) 
J0V(2) JNOV(3) 

还有下边的 [->:•] 


47 


rX:0, 转移 

JX[ 十 



55 


rX^[rX]?±M 

INCX(O) DECX(l) 
EI\TTX(2) ENNX( 3 ) 
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CI^tX(F) ： 1 

CMPX(0:5) 


rA = 寄存器 A 
rX = 寄存器 X 

rAX = 寄存器 A 和 X 当做一个 
HU = 变址寄存器 
iJ = 寄存器 J 
U = 比较指示器 


[- x . ] [ + ] : 
JL(4) < N(0) 

JE ⑸二 Z(l) 
JG(6) > P(2) 
JGE(7)^NN(3) 
JNE(8)^NZ(4) 
JLE(9)^NP(5) 





字符 00 01 02 03 04 05 06 07 08 09 10 

代码 LJ 


13 14 15 


K L M 


0 


17 18 

P Q 


20 21 22 
Ills 



24 

U 



01 


02 


无操作 


NOP(O) 


ADD(0*5) 

FADD(6) 


rA—rA - V 

SUB(0 ： 5) 

FSUB(6) 



10 



LDA( 


rI2^V 

LD2(0 ： 5) 


rl3—V 

LD3(0 ： 5) 


16 



17 




M(F)—rA 

STA(0 ： 5) 


32 




19 


13 


V 


LD3N(0 ： 5) 


27 



M(FW]3 

ST3(0 ： 5) 


33 


35 



M(F)—rJ 

STJ(0:2) 


M(F)—0 

STZ(0:5) 


设备 F 忙碌吗 

JBUS(O) 


控制，设备 F 

ioc ( o ) 


1BII 


41 


rll :0, 转移 

Jl [ + ] 


49 



HoHIa 


rA—[rA]?± M 

工 NCA(0) DECA(1) 
ENTA(2) ENNA(3) 


工 NC1(0) DECl(l) 
ENTl(2) ENNl(3) 


r!2<-[rI2]?±M 

INC2(0) DEC2(1) 
ENT2(2) ENN2(3) 


H3— [ rl3 ]?±!VI 
INC3(0) DEC3(1) 
ENT3(2) ENN3(3) 


56 



57 



59 



CI^rA(F)：V 

CMPA(0:5) 

FCMP(6) 


C 卜 r]l(F):V 

CMPl(0 ： 5) 


Cl—rl2(F):V 
CMP2(0 ： 5) 


Cl 


13(F) :V 


CMP3(0 ： 5) 


般形式 


C 


描述 

OP(F) 


C = 操作码，指令的 (5:5) 字段 
F = 操作码的变形，指令的 (4 :4 ) 字段 
M = 变址后的指令地址 
V = M ( F ) =单元 M 的 F 字段的内容 
OP = 操作的符号名 
( F )= 标准的 F 设定 


执行时间 


r = 互锁时间 



































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































Donald E . Knuth ( 唐纳德 • E • 克努特，中文 

名高德纳 ） 是算法和程序设计技术的先驱者， 
是计算机排版系统 T E X 和 METAFONT 的发明 

者，他因这些成就和大量创造性的影响深远的 
著作 （ 19部书和160篇论文）而誉满全球。作 
为斯坦福大学计算机程序设计艺术的荣誉退休 
教授，他当前正全神贯注于完成其关于计算机 
科学的史诗性的七卷集。这一伟大工程在1962 
年他还是加利福尼亚理工学院的研究生时就开 
始了。 Knuth 教授获得了许多奖项和荣誉，包 
括美国计算机协会图灵奖 （ACM Turing 
Award )，美国前总统卡特授予的科学金奖 
(Medal of Science ), 美国数学学会斯蒂尔奖 
(AMS Steele Prize ), 以及由于发明先进技术而 

于1996年11月荣获的极受尊重的京都奖 (Kyoto 
Prize )。 现与其妻 Jill 生活于斯坦福校园内。 

欲了解这位杰岀科学家和作家的更多信息，请 
访问. 

www . aw . com / cseng / authors/knuth 


欲了解本书和其它各卷的更多信息，请访问 

www — cs — faculty . stanford . edu/ 〜 knuth 

欲了解中译本的更多信息，请访问 

www . ndipxom . cn / computer/taocp 








计算机科学 / 程序设计 


它本来是作为参考书撰写的，但有人却发现每一卷都可以饶有兴致地从头读到尾。 一 位中国的程序 
员甚至把他的阅读经历比做读诗。 

如果你认为你确实 是一个 好的程序员，读一读 Knuth 的《计算机程序设计艺术》吧，要是你真把它读 
通了，你就可以给我递简历了 i —Bill Gates ' 


这一鸿篇巨制被广泛誉为对经典计算机科学的权威描述，头三卷在几十年来一直是学生、研究人员 
和业内人士的无价财富。 、 . • • 、 • 

參 

一部所有基础算法的宝典，今天的许多软件开发者关于计算机程序设计的绝大多数知识都是从该宝 
典中获得的。 Byte , September 1995 

不计其数的读者深受 Kmith 著作的影响。科学家们惊讶于他的分析的精美与雅致，而普通程序员每天 
都从其提供的“菜谱”中获得问题解决方案。书的恢宏、透彻、精确与幽默赢得了所有人的尊敬。 

我无法描述它们在我学习和娱乐中伴我度过的愉悦时光。我在车里，在餐馆里，在家里 . 甚至在 

我儿子棒球小联赛的间隙都忘不了带上它们， 一 有空就捧出来阅读。—— Charles Long 

不管你基础如何，倘若你想认真地编写任何计算机程序，你都有理由把这套书的任何一卷抱回家，以 
便在你学习和工作的时候随时翻 阅。. 、 

要是有一个问题难到要把 Knuth 的著作请下书架，那就太令人愉悦了。我发现，人们只要翻一翻它， 
就会对计算机产生极其有用的令人“恐慌”的影响。—— Jonathan Laventhol 

为反映该领域的最新发展， Kmith 二十多年来第一次将三卷书全部做了修订。他的修订主要集中在上 
—版以来趋于一致的知识，已经解决的问题，以及有所变化的问题。为保持本书的权威性，关于该领域先 
驱工作的历史信息都做了更新。为维护作者苦心孤诣追求至善至美的盛誉，新的版本将敏锐和苛刻的读者 

发现的少量技术错误都做了更正。增加了上百的新习题，对您也是新的挑战。 
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